Wekaを用いたデータの準備をする際,「どのようなデータを用意すべきか」で頭を悩ませることが多いと思います. 今回は,3つの観点からデータの準備について,説明していきます. データの内容 Wekaで利用可能な機械学習アルゴリズム(一部,回帰分析などの統計的手法),クラスタリング手法では,事例をいくつかの特徴量で表した表形式のデータを用いることを想定しています. 表形式のデータは,データベースで言うところのリレーショナルモデルによる用語でも説明可能です. データの作成の考え方特徴量(英語でFeature)は属性(英語でAttribute)と呼ばれますが,この属性に具体的な値(=属性値)を入れて,…