学会出張@東欧一日目: 学会全体が良い方向に向かっているのを感じる

初日はまず,前日連絡がついた現地の修理センター兼販売店にバッテリの切れた PENTAX K-5 を持って行った.ホテルから学会会場が至近で,かつ修理センター兼販売店が会場の反対側だったため,早めに参加受付だけを済ませて販売店に急いだ.店は会場から徒歩15分ぐらいとやや遠め.
店に向かっている道すがら,街を歩く人や道端の店,建物などを眺めていたら,少しずつこの街らしい風景が見えてきた.特にユニークだと思われるのは,

  • 犬(ペット)が放し飼い.大型犬が多く,暑いからかよく地面に転がっている.夜歩いていて,すれ違いざまに大型犬が威嚇してきたときはちょっとびっくりしたが,飼い犬をリードで繋がなくても良いというのは.良いなあ.
  • 半地下で,地面すれすれに窓口を構えた*1売店があちこちにある.買うときに客がしゃがんで買う光景が新鮮.雨が降ったらどうするのだろうか?
  • 車が歩行者に優しい.両側2車線など道幅があリ交通量がある道路で,信号がなくて横断歩道だけというところが結構あるのだけど,渡り始めると周りの車がどんどん止まる.というか,横断歩道の途中で躊躇していると止まった車に(早く渡ってと)クラクションを鳴らされるぐらい.
  • 街並みとは関係ないが,ホテルの食事が充実している.様々な家畜(牛,羊,バッファローなど)のヨーグルト,ブルー,イエロー,ホワイトチーズ(白のはシレネと言うらしい),様々なソーセージ類などなど.クロワッサンが並以上に美味しくて助かった.無線LAN も繋がって会場も徒歩5分とホテル大当たり*2

さて,店には開店と同時に入ったのだけど,メールで連絡をとった Petar さんがまだいないとのことで5分ほど待った.ショーウィンドウには PENTAX 製品がずらり.しばらくして,来た Petar に空のバッテリを渡したら,君,抜けてるねぇなどと言いながらも(いや本当にそうだけど),空のバッテリを充電している間に使って,と代わりのバッテリを貸してくれた.夕方受け取りに戻ると言い残して学会会場にとんぼ返り.
その後は丸一日みっちり発表を聴講.口頭発表は1セッション3件(short paper は4件)だったのだけど困ったことに1セッション全部聴きたい,というセッションが無く(というか,聴きたい発表の発表時間が被っていることが多く),発表単位であっちこっち移動することになって,えらい疲れた.8階建ての学会会場で,発表がある部屋が上層階と下層階(1セッションだけ)に分かれていてこの間の移動は時間的にも辛そうだったので,上層階のセッションを中心に聴講.また,午後の2セッションは休みなしで連続していて,疲れるし移動を強いられるしで参った.誰が考えたのこれ?5分ぐらい挟んでくれたらいいのに.
ランチは出身研究室時代に研究員だった方と現地料理を食べに行った.ブルーチーズのソースがかかった臓物パイのようなものを食べたら,結構ヘビーで難儀した.食べながら,テニュアを捨てて研究員に戻った理由などを伺ったりするなどした.人生いろいろ.タクシーに乗った時から感じていたが,ここは物価が非常に安いようで,食べるのも移動するのも,西欧の平均と比べて半分ぐらいのコストで済むようだ.
初日の聴講で印象に残った発表を列挙すると,

  • Language-Independent Discriminative Parsing of Temporal Expressions: ヒューリスティクスで解かれることが多いニッチなタスクに,一歩引いた視点からまじめに取り組んでいる研究.研究としてのインパクトはあまりないと思うが,エラー分析をしっかりしているのには好印象.
  • Adapting Discriminative Reranking to Grounded Language Learning: 面白い問題設定で,手法も古典的ながらうまく設計されている.自分が馴染みがなかっただけかも知れないが,新しい流れを感じた研究.
  • Automatic Interpretation of the English Possessive: 第一著者が来れず Eduard Hovy が発表していたのだけど,ほとんど注釈付けの話だった.発表者の色が出たのだろうか?分析系の話は技術の押し売りみたいな研究と比べて知見が沢山得られるので,外れが少なく安心して聴ける.
  • Modeling Thesis Clarity in Student Essays: エッセーの明瞭性を評価する研究.この手の「質」を扱う研究は評価データの設計が難しいのだけど,その辺りを意識してタスクをうまく切り出したな,という印象.
  • Natural Language Models for Predicting Programming Comments: プログラム中でプログラマのコメント入力を支援する言語モデルを学習.これぞ short paper という発表で,実験もよく設計されていて良い.他の long paper の落ちこぼれ的な発表とは違い明らかに異彩を放っていた.

全体として(MT 系のセッションに参加しなかったからかもしれないが)手法の技術レベル押しの論文が減っているような印象を受けた.また,2010年ぐらいから進められている,採択する研究を多様化するという流れは更に進んでおり,学会として健全な方向に向かっているように感じた.あとコードやデータの公開を宣伝する発表が多かったことも強く印象に残った.正確には数えていないが,聴講した発表では 1/3〜1/2 ぐらいの研究で何らかのコードやデータを公開していた(ように感じた).
その他,学生の役に立つかと思って聴いた

  • The Haves and the Have-Nots: Leveraging Unlabelled Corpora for Sentiment Analysis

は(どれもこれも既存研究の手法の借用,という説明で)新規性があまり感じられず,面白くなかったのだけど,単純に Brown クラスタリングしてクラスタ素性を入れたら評判分析のポジネガの分類精度が 87% -> 97% に上がったという報告に絶句.正直,その実験大丈夫?と思っていたら,同じように感じた聴講者が他にもいたようで,ずいぶん上がるんだね,なんで?というような質問していた(使ったデータセットの加減で上がったのでは,というようなもやもや回答).
最後に,深層学習 (RNN) で学習した句表現と PCFG と組み合わせた構文解析の研究

  • Parsing with Compositional Vector Grammars

では,PCFG を前段に使って解候補を絞ることで,後段の RNN で必要となる行列計算を減らして高速化するという話だったのだけど,(以下思い出して書いているのでうろ覚え)ここに Yoav Goldberg が深層学習って,分野研究者が分野特有の工夫をしなくてもうまくいくってのが売りなんじゃないの?と突っ込んでいたのが印象的だった.関連して,Mark Johnson が,単純な PCFG ではなく,複雑化した(例えば語彙化した)PCFG を組み合わせるのはどうか,というような質問をしていた(質問の順序としてはこっちが先).離散と連続,またモデルの解釈可能性というのは,この分野で手法を設計する上で,自分なりの答えを出していかないといけない問題だよなあ.
初日の最後のセッションはポスターセッションで,自分たちは発表があったので貼ったポスターの前に待機.口頭発表のセッションもそうだけど,ポスターセッションも会場がバラけてしまっていて(複数階,かつ各会場が連続していない),人もバラけてしまいっている感じで,なかなか辛かったのだけど,それでも何人かは聴きに来てくれて,話ができた.この会議では,ポスター発表も口頭発表も論文としては同格扱い*3だけど,(発表形態を自分で選んだわけではないのだから)もう少しポスター発表者に敬意を払った扱いをしてくれないと悲しいな(たくさん採択すればいいってもんじゃないよ).
夜は発表した三人で打ち上げ.ビール一杯330mlで100円.500mlでも140円ぐらい.どんだけ安いの.この国に住んだらアル中になること間違いない.今日は聴講といい,K-5 のバッテリの充電といい,移動続きで,さらに最後に発表があって,非常に疲れた一日だった.ともあれ,初日に発表が終わるのは気楽でござる.
[追記] 初日の研究では,同僚氏も聞いていたが,

  • Unsupervised Transcription of Historical Documents

が問題設定と,手法(技術)共に面白そうな感じ.自分の考える理想的な研究として,問題設定に新規性・重要性が認められ,かつ,技術もその問題に対して新規に設計・洗練されている,というのがあるのだけど,そういう研究ってこの会議でもそれほど多くない.斬新な問題設定ながらベースライン程度の手法,あるいは陳腐な問題設定に対して技術の押し売り,というのは研究している人も楽しくないと思うけど,聞いていても当然楽しくない.

*1:写真より,もう一段下に窓口を構えた店が多かった.

*2:唯一,部屋で湯が沸かせず珈琲を入れるのに困ったのだけど,朝食時に聞いたらお湯を分けてもらえた.一日目は既に沸かされたお湯をもらったらぬるくてうまく入れられなかったので,二日目以降は沸騰したお湯をくれといって機械から直接入れたお湯を分けてもらった.で,入れた珈琲をサーモスの真空断熱マグで会場に持ち込み,ごくり.珈琲うまし.

*3:論文集でも区別されていない.発表形態は採録後に決まったのだけど,査読者のスコアが低い方をポスターに回したというわけでもないらしい.期待できる聴衆の多さで決めている感じ?