教師データはいくつ? とりあえず10000のランダムなポイントでとしてはじめたんでした。で、サンプリングしてRに持ってきてみたんですけど、データの偏りがすごい。 開放水域 耕作地 高木林 湿地 人工物 水田 草地 低木林 裸地 2723 225 5949 8 627 1083 236 231 82 いやー、どう考えても8点(湿地)だけではどうしようもない。なので100,000くらいに増やしてみたんです。が、そしたら後々のランダムフォレストの分類機を作る手順でデータ多すぎですエラーがでた。ちゃんと説明で、そういうことは止めてねと書いてあるので、するべきではありませんでした。 これを踏まえて、元の…