要件 組の学習データが与えられているとします。 番目の学習データの特徴ベクトルはと表されます。 クラス存在すると想定し、とします。このときです。 この学習データを使った分類木の学習アルゴリズムの一種CARTを以下で説明します。 不純度 各ノードに番号を割り当てます。 根ノードの番号をとします。 ノード番号のノードに割り当てられる学習データ番号の集合をと定義します。 の中でクラスがであるデータの割合をと定義すると、以下の式で表せます。の学習データにおける不純度をで表すことにします。 はエントロピーやGini関数などが利用されます。 CARTアルゴリズムではGini関数が用いられることが多いようで…