MIRU-山元

皆さん、こんにちは。山元です。

長かった夏も終わり、ここ最近は、ずいぶん涼しくなりましたね。
キャンパスの銀杏並木も綺麗に色づき、鳴り響いていた虫の音も蝉からコオロギへ。。。季節の変わり目を節々に感じる日々です。(それにしても、銀杏臭半端ないです。笑)

さて、約2ヶ月間という長いようで短い夏休みがあっという間に終わってしまいましたが、皆さん、今年の夏はいかがお過ごしでしたでしょうか。
僕個人の感想を述べますと、色々なことに挑戦した夏ではありましたが、俯瞰して見ると、予定していたタスクの半分程度しかこなせず(特に研究)、反省の残るものとなってしまいました。
休みの有効な時間の過ごし方というのは、なかなか難しいものです。

そんな夏休みですが、具体的にどのようなイベントがあったのかを時系列で簡単に並べてみると、7月終わりから8月初めにかけての国内学会MIRUへの参加に始まり、i-ref棟への引っ越し、レポート提出、合宿、集中講義、勉強会、企業訪問、シンポジウム、シリコンバレーへのインターン、研究室旅行と、多くのイベントが続きました。

しかし、夏休み初めにMIRUに参加してから、もう2ヶ月も経つのかと思うと、月並みですが、時の流れの速さを感じずにはいられません!!
研究室のみんなは1ヶ月以上前に、とっくに感想を書いているので、夏炉冬扇ではありますが、僕もMIRUの報告記事を書かせていただこうと思います。

MIRUは、今回初めての参加だったのですが、自分と同じ分野の研究者の皆さんや研究に触れることができ、非常に有意義な経験でした。
この記事では、僕の興味のある研究分野であるデータマイニングと感性情報処理の研究を中心に、応用先が面白そうな研究をいくつか紹介させていただこうと思います。

ユーザ履歴を利用した潜在トピックによるユーザの画像嗜好のモデリング
片岡香織, 木村昭悟, 村崎和彦, 数藤恭子, 谷口行信
画像検索を行う際、各ユーザの画像に対する好みを考慮した検索結果表示を行うためのモデリングに関する研究
Gistなどの画像特徴を入力として、個々のユーザが好みの画像を選択する過程を潜在トピックモデルによりモデル化する。ここでは、嗜好は画像の前景部分に反映されると考え、あらかじめSilency mapを用いて前景部分と思われる領域を抽出し、その領域の特徴量を量子化して用いる。
この研究では、データセットとしてPinterest*1の画像を用いている。実験の流れとしては、pintesestの各ボードを1ユーザとみなして、各ボードからテスト画像を1枚とってきて嗜好度を計算し、ボード上にあった画像が、他の画像より上位に来るかで嗜好度の推定精度を測る。各個人の感性や嗜好にあった検索システムという、個人的にかなり興味深かった研究。

ソーシャルキュレーションデータを用いた画像コンテクストマイニング
木村昭悟, 石黒勝彦, Alejandro Marcos Alvarez, 片岡香織, 村崎和彦, 山田誠
内容を考慮した(セマンティックギャップを超えた)画像認識・検索のためのコーパスを構築する研究
上の研究と同様、pinterestを用いている。上の研究でもそうだが、データセットとしてPinterestの素晴らしい所は、

  1. ユーザが気に入った画像をpinしているので、そのユーザの嗜好がよく表れている
  2. テーマごとにボードが分かれているので、各ボートに含まれるコンテンツは共通のコンテクストを保持している

1だけであれば、他のSNSでもある程度言えることだが、2が重要。pinterestでは、各ボードごとに、ユーザが一貫した指針に基いて画像を収集・選択しているので、共通するコンテクストを持つ画像群を検出することが可能。この研究では、その利点を利用してコーパスを構築している。具体的には、まず、repin*2を介した画像伝搬をグラフとして表現する。ここで、伝搬を通じて数多くの画像を共有したボードの対は、類似したコンテクストを持つと期待されるので、グラフクラスタリングにより、画像コンテクストの検出ができる。
これも、上の研究同様、ソーシャルデータを用いたかなり興味深い研究だった。

マルチモーダル情報を用いた実世界物体認識
木村大毅,長谷川修
自己増殖型ニューラルネットワーク(GNGとSOMを拡張した追加学習可能なオンライン教師なし学習手法)で学習するロボットを用いた、実世界物体認識に関する研究。
ロボットが持つマルチモーダルセンサ情報をオンライン転移学習する。
マルチモーダル情報を用いる際、属性によって、各モーダルの判別しやすさが異なるため、単純にモダリティを統合しただけでは、属性の判別に不向きなモーダルに関する情報も判別に用いてしまい、認識率の低下を引き起こしてしまうが、この研究では、これらの得意・不得意を、「モダリティと属性の関連度合い」と定義し、学習時に関連度合いも算出し、認識時に関連度合いを活用したモダリティの統合を行うことで、認識率を上げているところがポイント。
実際にデモを見たが、完成度の高さを感じた。

Bag-of-Colorsを用いた食事画像認識
高松幸広, 河村聡一郎, 相澤清晴, 小川誠
食事画像から食事のメニューを自動推定する技術の研究。
食事画像からBag-of-Colorsヒストグラムを生成し、Naive-Bayes Nearest Neighborを用いてマッチングを行う。同じユーザがそれまでに撮影した食事画像をデータベース画像として用いることで、精度を向上させた。認識率にはまだ大きなバラつきがあるが、
東大の相澤先生の研究室の研究で、実際にFoodLogというWebサービスで、大学発ベンチャーとしてビジネス展開しているので、今後の展開に注目したい。

・[[[[snapper:ファッションスナップサイトを用いたコーディネート画像検索システムの提案と実装]]]]
三浦慎也, 相澤清晴
衣服の画像に対して、参考にすべきコーディネート画像を検索することが出来るシステムの研究。
処理の流れは、全コーディネート画像から各領域(アウター、ボトムス等)を抽出した後、各領域から画像特徴量を抽出して、特徴量データを生成。そして、入力(自分のコーディネート画像)に対して特徴量マッチングを行い、検索結果を出力。
これも、相澤先生のところ。正確な領域抽出などハードルは高そうだが、画像のメタデータ等色々絡めると、より面白そう。

顔画像による印象度推定
藤田光洋,伊原康行
顔画像から、見た目の印象度を自動的に数値化する技術の研究。
顔の印象度は、個人の主観に大きく左右されるものなので、正解値を定義するのが非常に難しいと思うが、デモがなかなか面白かった。
デモでは、メイク前後の顔の印象度の比較だったが、個人的には、それが良いか悪いかは置いといて、結婚相手紹介サイトなどで印象度から検索できると面白いと思った。



最後に、おまけではありますが、先に述べましたように、9月半ばにJUAS様のインターンで、シリコンバレーの12企業1大学を視察で回ってきましたので、そこで得た価値を一つ紹介したいと思います。

シリコンバレーでは、新しい事業開発プロセスとして、リーンスタートアップというものが非常に注目され、盛り上がっているそうです。
リーン(lean)というのは、贅肉がなく引き締まっているという意味で、つまり、リーンスタートアップとは、無駄なものを出来る限り削ぎ落としてスピーディーに事業開発を行う、ということです。

具体的に言いますと、「構築-計測-学習」フィードバックループを高速で回していくことで、小さな失敗を繰り返しながら軌道修正して、事業を価値のあるものにしていくという手法です。

具体的に知りたい方は、以下の本などを読んでみて下さい。

リーン・スタートアップ

リーン・スタートアップ

この本によると、イメージとしては、「地図を捨ててコンパスを頼りに進め」ということらしいです。

何をするにしてもスピードが求められる現代ですから、リーンスタートアップの考え方や手法は、スタートアップのみならず研究を進める上においても、とても重要だと感じました。とにかく手を動かさないと、何も始まりませんからね。
このシリコンバレー視察の報告は、またブログやslideshareで皆さんと共有できたらと思います。


先生にもよく言われることですが、このインターンもそうですし、日々の研究も多くの方々の支援があって初めて行うことができます。
少しでも、その支援に報いることができるよう、粛々と邁進していきたいところです。

それでは、長々とまとまりのない文章失礼いたしました。

今回はこの辺で失礼します。

*1:Pinterestとは、画像や動画を貼り付けて共有できるソーシャルキュレーションサービス。ユーザは、ファッション、スポーツなどのテーマごとにボードを作成し、自分の気に入った画像や動画などのメディアコンテンツをpinという形で貼っていくことができる。ピンボードに写真を貼る作業をWebで行うイメージ。

*2:twitterでいうretweetのような機能