カラムがあったらとりあえず件数をカウントしておきたくなるのがデータサイエンティストの人情。以前にもデータが不均衡だったせいでクロスバリデーションが上手くいかずに痛い目を見た経験があります。※ そんなこんなもあって不均衡は見ておきたいので確認していきましょうというお話です。 まずカウント 何はともあれ不均衡であることを確認します。 import matplotlib.pyplot as plt df = clens_train.copy() # 適切なデータフレーム名に置き換えてください # 選択したカラムを指定 selected_columns = ['Gender'] # 適切なカラム名に置…