頻出飽和集合とかのメモ

前回のデータマイニングの続き。ちゃんと書きたいけど、まだよくわかってないので今はちょっとだけメモ。

宇野先生の研究業績のページで頻出集合や頻出飽和集合関連のわかりやすい資料を見つけた。超大作パワポ「いいプログラムはコーディング技術だけではない」。中身とタイトルはあまりあってないですw 言いたいことはわかるけど・・・
前回冒頭に挙げた頻出集合アルゴリズムの入門PDFあわせて読みたい

あの後、LCM のコードはほとんどみてないけど(論文を読んでまねしてコードを書く部分を楽しんでるのと、ぱっと見てわかんなかったから)、頻出飽和集合が一発で求められるようになりました。後処理で削除してた部分がいらなくなり、前回1.2秒と言ってた処理が今や0.3秒で終わります。前処理も除けば0.15秒ほど。LCM と答えあわせをしてみると、答えの件数が一致するのであってるっぽい。

とりあえず、宇野先生の飽和集合関連のいくつかの論文に出てくる極大2部クリークって何さ?ってところをまとめた。
http://docs.google.com/Presentation?id=dqf99wm_1632cn22mpd7

極大2部クリークよりも頻出飽和集合のほうが具体的なんで、わかりやすい。
2部グラフって小学生のテストとかに出てくる「線で結びなさい」ってやつを思い浮かべるといいかもw