kisa12012の日記 RSSフィード Twitter

2013-12-15

機械学習界隈の情報収集方法

こんにちは.Machine Learning Advent Calendar (MLAC) 2013の14日目を担当します,@です.普段は博士学生として,各地を放浪しながら機械学習の研究をしてます.今回の記事はボストンで執筆しています.現地時間(EST)での締切は守ったのでセーフ…ですよね?

本日は機械学習の技術的な内容の話ではなく,筆者が実践している機械学習関連の情報収集方法について纏めます*1.大きく分けて,学会情報の管理・論文情報の収集・その他の三種について述べたいと思います.今回のトピックの多くは他の分野にも通用する話になっているかと思います.他の分野の方がどのように情報収集されているのかも気になるところです.

学会情報の管理

  • まずは学会情報の管理についてです.機械学習に関連するカンファレンスは(特に近年乱立気味で)非常に沢山あります.全てをチェックして回るのは,極一部の超人を除く通常の人型生物には不可能なタスクです.代表的な学会を個人的な印象とともに,以下に簡単に記載すると*2
    • ICML/NIPS/AISTATS/ECMLPKDD は機械学習系の最先端論文が集まるカンファレンス.最新の動向を見るために,必ず採択論文のチェックが必要.
    • UAI/ICLR/COLT は会議毎にクセが強い.機械学習の中の一分野のみを対象としている事が多いが,総じて質は高いため自身が関連する学会はチェックが必須.
    • KDD/IJCAI/AAAI/SDM/ICDM/WWW では上の機械学習手法の実応用への拡張が豊富.WSDM/CIKMも見逃せない.
    • ACL/EMNLP/ICCV/ECCV/CVPR/ICASSP は言語処理・画像処理・音声処理それぞれの分野に適応した手法の提案が多数.ここでのアイデアや手法機械学習系へ逆輸入されることも多々.
    • VLDB/SIGMOD などのデータベース系でもたまに機械学習系の論文がちらほら.
    • JMLR/MLJ/TPAMIなど,ジャーナルも多数.
  • があります.とても全部は追いきれないため,学会の開催情報や締切情報の効率的な管理が必須です.以前は色々試していましたが,一年程で更新が止まるサービスが多く持続的な管理には不向きな事が多かったです.最近は,自分でWikicfpのリストを管理する方法に落ち着いています.
  • Wikicfp http://www.wikicfp.com/cfp/
    • 主に学会の締切情報管理に利用しています.論文投稿のデッドラインを効率的に管理出来る点で気に入ってます.
    • 自分が管理したいカンファレンスをリストに登録すると,論文投稿締切前や開催前にメールやRSSで連絡をしてくれます.
    • また,アーカイブに過去のカンファレンスを保存しておくと次年度の情報もメール等で連絡してくれます.時系列表示やical形式での登録も可.
    • 筆者が管理しているWikicfpはこちら.上で挙げた会議+αの管理に利用しています.

論文収集

その他情報の収集

筆者が実践している情報収集方法について,ここまでだらだらとまとめてきました.日々これらの情報を通して基礎体力をつけつつ,自分のタスクに繋げるための勉強として,近年のD論サーベイ部分あるいは書籍を読む→引用論文で重要なものをピックアップして読む→これらの知識を土台に最近の論文に当たる,のプロセスを回すのが最短経路であると思います.

おそらく2・3年後には,今とはまったく異なる情報収集方法に変わっているものと想像します.日々改良を重ねてより良い方法を探索していきたいです,とありきたりな言葉で本日のMLACを締めさせていただきます.

*1:NIPS2013参加報告を書こうかとも考えたのですが,I'm a banditブログ記事で筆者が重要だと思ったことの半分程度は既に解説されてしまいました.確率的最適化や近接勾配法まわりの今年のブレークスルーは,こちらの記事を参照すれば大雑把に把握できると思います.それ以外の分野で面白いと思った話については別の機会があれば後日紹介したいと思います. NIPS読み会などでしょうか?

*2機械学習の「朱鷺の社Wiki」でも機械学習関連の学会情報を簡単に纏められています.

Connection: close