どこでも見れるメモ帳 このページをアンテナに追加 RSSフィード Twitter

2014-12-23

[][] はてブ記事を用いた興味分析

はじめに

「ある時点までの自分自身の興味推移に即して,いま最も面白いと感じるであろうコンテンツ*1を推薦したい」
というモチベーションで、興味分析関係の記事を連載します.
試行錯誤中ですので,どの程度の性能を実現できるか不明ですが,その試行錯誤内容を記事にまとめたいと思います.

アプローチをざっくり書くと,次のようになります.

  • インプットとして,はてブに登録したブログ記事群をこれまでの自分自身の興味の推移として扱う.
  • トピック解析関連の技術を用いて,これまでの興味を分析,これからの興味を予測する.
  • アウトプットとして,ブログ記事を推薦する.

進捗次第,以下の記事一覧に記事を追加していきたいと思います.

記事一覧(目次)

  1. データの準備(はてブからのブログ記事の取得・形態素解析)
  2. LDAによるトピック解析*2
  3. HDP-LDA*3によるトピック数自動決定可能なトピック解析
  4. DTM*4によるトピックの時系列解析
  5. Kleinbergのバースト解析による特徴的なトピックの抽出
  6. ...

現在のところDTMによるトピックの時系列解析まで完了しています.
記事が完成次第リンクを張っていきます.

*1:ブログ記事,楽曲,小説,映画,漫画,…

*2:LDA:Latent Dirichlet Allocation

*3:Hierarchical Dirichlet Process-LDA

*4:Dynamic Topic Model, 時間方向拡張のLDA

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証