コンペ上級者がどんな考え方でコンペを進めているのかを調べる目的で過去のコンペに挑戦。 今回はHome Credit Default Risk ハウジングローンの信用評価の2値分類。 特徴、提供されたテーブルの多さ。 メインキーのSK_ID_CURRの下にSK_ID_BUEAU,SK_ID_PREVという別のキーがあり、それらをSK_ID_CURRにどううまくまとめて紐づけるかがポイント。 何事もステップを踏んでいかないと道に迷って(=どのモデルが良いかわからなる。)大切な時間を無駄にすることに最近気づいたので以下の順番で一歩ずつ進めた。 applocation_train.csvのデータのみで…