機械学習・前処理の黄金律 〜データクレンジングからGridSearchCVまで〜 機械学習の前処理:まずはデータをよく見る 機械学習では、いきなりモデルを作るのではなく、まずデータの状態を確認することが重要です。 データの形や欠損値、データ型などを把握することで、適切な前処理を行うことができます。 データのサイズを確認する(df.shape) 最初に、データフレームの行数と列数を確認します。 import pandas as pd df = pd.read_csv("data.csv") # データの行数と列数 df.shape 例えば、結果が (1000, 10) と表示された場合、 「10…