機械学習でよく悩まされる次元の呪いと組み合わせ爆発を整理します🐜 次元の呪い 具体例 対策 組み合わせ爆発 終わりに 参考文献 次元の呪い 次元の呪いとは、ある系について機械学習モデルを構築するとき、精度向上のために特徴量(次元)の数を増やしすぎると、用意すべき学習データの数が指数関数的に増大してしまうことを指す。 具体例 グレースケールの3x3画像データを考えてみます。1画素が256階調1とすると、この画像データは通りあります。このサイズの画像データでさえ25桁のデータ量であり、どんなモデルでも数枚の画像では学習データとして全く足りないことがわかります。 しかも実際は、例えば4k画像でデータ…