Hatena::ブログ(Diary)

ny23の日記 このページをアンテナに追加 RSSフィード

2013-08-07 零日目などと煽るタイトルをつけたばっかりに

学会出張@東欧三日目: 機械学習のセッションに出るの忘れてた

| 学会出張@東欧三日目: 機械学習のセッションに出るの忘れてたを含むブックマーク 学会出張@東欧三日目: 機械学習のセッションに出るの忘れてたのブックマークコメント

三日目は体調も良好で,一日しっかり聴講することができた.学会も最終日だからかセッション数も一つ少なく,ややゆとりのあるスケジュール.三日目も色々な発表を聞いたが,記憶に残ったのは以下の3つ.

  • Machine Translation Detection from Monolingual Web-Text: MT で自動翻訳された文書を識別する問題.面白い問題設定で,かつ,問題に関する深い観察・理解から導かれた手がかりを用いて識別器を構築しており,誠実な研究という印象を受けた.テストデータの作り方がやや人工的,局所的で苦しく,多分に苦労の跡が感じられる.ここは2日目で触れたテキスト再利用に関するコーパスのように,ユーザに機械翻訳結果を利用しつつ翻訳してもらってコーパスを作り,評価していたら,隙もなくより妥当な評価ができたのではないかな*1.企業の研究らしく実世界データを用いた実験もあって,こういうところは見習いたい.
  • Offspring from Reproduction Problems: What Replication Failure Teaches Us: WordNet に基づく類似度尺度(計算)と NER に関する既存手法について再実装により実験結果の再現を試み,その成功と失敗から得た教訓について議論した研究.最初,スライドなしでトークが進み,あれ?スライドなし?と思っていたら,半分ぐらい時間を使ったところでスライドを使った発表に移って,少し知見を話して終わり.手法の再実装を容易にするため,実験結果を公開しましょう,という話もあったりして,3月の講演で同じことを話していた自分としては,先に話しておいて良かったと思った(というか,主張自体もかなり被っていて共感した).質問で,ここで実験結果の再現で困った経験のない人はいるか?この発表が Best Paper Award(を受けるべき)だ,などと叫んでいる人がいたが,流石にそれは言い過ぎかと思う.しかし,この論文が口頭発表で採録されるということの意味は,よく考えた方が良いと思う.
  • Good, Great, Excellent: global inference of semantic intensities: 昨年から始まった,国際論文誌採録→国際会議発表枠の論文.同義の形容詞を,形容する性質の強さの順に並べるというタスク.言語的なアプローチと数理的なアプローチをうまく組み合わせていて,手を尽くしている感があった.結果も inter-rator agreement と変わらないところまで辿り着いているので,この後に同じタスクで追随するのはちょっと厳しそう.

2つ目の研究は一昨年の同会議の business meeting での Ted Pedersen の以下の議論を踏まえて行われたようだ.ちょうど参加しなかった会議で,知らなかった.明らかに3月の講演の時に触れるべき内容で,サーベイ不足を反省.

というわけで,三日間に渡る会議もこれにて終了.セッションとしては,国際論文誌採録→国際会議発表枠のニセッション目が面白かったそうな.論文誌に良い研究が流れて会議論文の発表はイマイチだったと言う人もいたが,個人的には数年前の同会議よりよっぽど面白かったのだけど.感性の違いかなぁ.自分の分野には,今回参加した国際会議の他に,もう一つ大きな(歴史の長い)国際会議*2があって,自分はそちらの会議の幅広く論文をとる懐の深さが好きだったのだけど,こちらの会議もそういうところが今回は見受けられて,参加していて楽しかった.

昼はランチの時間を利用して,同僚氏とタクシーで近郊のフレスコ画で有名な教会(世界遺産)を訪ねて,中の人にフレスコ画に描かれた人物に関する説明を聞いたりした.地味だけどこういう遺跡,割と好きだな.夜は,今回の発表者三人で最終日打ち上げに行く途中,偶然に初日にランチを食べた研究員の方と会ったので合流して近くのビアバーへ.半地下の小部屋で,近所の野良猫を眺めながら,丸まったソーセージやマッシュルームのバター炒めなどを食べつつ,ビール片手に夜遅くまで語り合った.このぐらいの人数で食べたり話したりするのが自分にはちょうど良い.

今回,ホテルの朝食は美味しいのだけど,三日間同じとなると少しばかり飽きてくる.この辺りが帰りどころかな.今回,初日から二週間ぐらい前の記憶を遡りつつ日記を書いたのだけど,こんなことなら零日目などと書かなければよかったと少し後悔(本当は PENTAX K-5 のバッテリの笑い話を書きたかっただけ).

*1:コーパスを作っても企業だと公開するのは難しそうなので,この程度で留めておくのが合理的なのかもしれない.論文としての焦点もうまく書かないとぼやけるし.

*2:近年,学会運営の不手際などもあって,やや評判を落としているらしい.