クラスタリングとクラス分類って違うらしい

概要

卒業研究の題目について担当の先生に相談した際にハッと気付かされた。

題目を「評価要因に着目した評価情報分類」で考えています。と切り出し研究の内容について紹介した。

レビュー集合を用意(Amazon.co.jp, kakaku.com)
 ↓
レビュー文から評価表現辞書を用いた評価要因を抽出するパターンを考案・実装・適用
 ↓
評価要因の抽出
 ↓
抽出した結果をtf-idf法を用いてベクトル化し、レビュー集合をクラスタリング
 ↓
レビュー集合を直接クラスタリングしたものと比較
 ↓
今回の提案手法を用いると、評価軸ごとにレビュー集合を分類できることを検証する

という内容で相談メールを送信したところ、先生から返答をしてもらった、以下が先生の返答の一部の抜粋。

「分類」と「クラスタリング」のどっち?
「評判情報分類」で終わってよいのか?

衝撃的だった。えっ!?分類とクラスリングって意味違うの???一瞬混乱した。意味の違いがわからなかったので、調べてみることにした。その際のメモ。

続きを読む