Hatena::ブログ(Diary)

worldwidewug #3 このページをアンテナに追加 RSSフィード

June 18(Sun), 2017

前処理職人は日々是鍛錬

今週は先週とは打って変わってWiki markupのparserと格闘していました。既存のツールをいくつか試したのですが、どれも自分の目的に対してはHalf-bakedなもが多く、結局ASTに対して自分で所望の処理を書く羽目になりました。そもそもWiki markup自体が大変uglyで、書き手によってはかなりtrickyな構造を使っていたり、その他Heuristicに除外する必要があるものがあったり云々、久々の前処理職人ウィークでした。WikiやWebのparsing等、前処理職人としての鍛錬は、NLP研究者にとって欠かせないと思います。(今週の作業を通じて、Htmlが混じったWiki markupに対する理解が少し深まりました。今後、QAや世界知識を用いるタスク等で活かせると良いなと思います。)

インターン外ではEMNLPのresponse&reviewがやっと終わったかと思ったら、今度は別のワークショップからまたreviewの依頼が。。。今回は2本なのですぐ片付けられそうですが、ToDo stackがなかなか片付きません。

また、(問い合わせに急かされる形で)ACLのcode&documentは大分整ってきたので、6月中にはリリースできそうです。

June 11(Sun), 2017

時が加速する

明日からはもう4週目ということで、時間が立つのが早くなってきました。

今週はJavaと格闘していました。また、もう一つのプロジェクトのアイディアも少しずつ形になってきました。

インターンとは別件で、火曜日に急遽論文を書くことになり、共著者の皆様と怒涛の勢いで書き上げて提出しました。自身の執筆最短記録間違い無しです。

基本的に朝から夕方まではインターン(フルタイム)なので、ホテルに戻ってからの限られた時間でなんとかやりくりしています。上の論文に加えて、EMNLPのauthor responseを書いたり、reviewer responseをしたりと、夜までびっしり忙しい状態が続いています。

さらにはACL論文のコードの整理(&ドキュメンテーション)もそろそろ仕上げたいところです。今回は発表前から論文やコードの問い合わせが結構多く、色々手一杯となっております。

ベンとの(サイド)プロジェクトは言うまでもなく手が回らない状態です。面白いトピックなので早く進めたいのですが、、、。

週末はIrvingtonという(車で15分くらい離れたところにある)風光明媚な別荘地エリアへマンションツアーに行ってきました。お昼はお目当てのカフェが閉まっていたり、次に見つけたお店も現金のみということで(うっかり現金を持ち合わせていなかったので)諦め、更に別のお店に行ったのですが、なんとこれが大当たりで、NY滞在中にまた来そうな予感がします。人生万事塞翁が馬、ですね。(写真

June 05(Mon), 2017

ハードルは低いほうが良い

週末はNew York Botanical Garden(NYBG)へ行ってきました。天気も良く、たくさんの人がいましたが、中はそれ以上に広かったので、のんびり過ごすことができました。(写真

NYは人が多すぎてあまりのんびりできない、という(マンハッタンの)負のイメージが強かったのですが、「そんなに悪くもないかな」と、少しだけ印象が変わりました。

ただ、走っている車が多かったり、高速の車線が狭かったり、アップダウンやまがりくねりだらけで、気が休まらない感じは依然としてありますが、、、。

また、この夏にACLで発表予定の論文がoutstanding papersに選ばれたようです。素直に喜びたいところですが、今回は他のペーパーに比べて好意的な査読者(&AC?)に恵まれただけという感もあります。

毎回の結果(や賞の有無)に一喜一憂するのではなく、多くの人に影響を与えられる(&引用してもらえる)ようなアイディア、データ、タスクやツールを考えることが大切だと考えていますし、これからも(これまで同様)日々淡々と精進したいと思います。

まずは、いつも通りしっかりと発表準備をして、良い発表ができるようベストを尽くしたいと思います。(選ばれたことによって、無駄に発表のハードルが上がってしまったような気がしますが、、、。)

ちなみに、論文の書き方については

どう書くか―理科系のための論文作法

どう書くか―理科系のための論文作法

が秀逸です。これを読んでから、論文を書く際のスタイルが明らかに変わりました。

June 02(Fri), 2017

誰もが一度は通る道

週末は近所のモール(複数)を探索したり、電車でNYCまで出かけてきました。最寄り駅まで徒歩10分強とはいえ、電車1本でGrand Centralに出られるのはかなり便利です。(写真)


今週は実装タスクに加えて、新しいアイディアのためのブレインストーミングやディスカッション、最新の論文のキャッチアップがメインでした。QA分野はどうやら2016年から恐ろしいスピードでレッドオーシャン化しているようで、「面白いアイディアを思いついたかも!!」となっても、先月出たarXivや今年のACLの論文タイトルに同じものが見つかってがっかり、、、というパターンの繰り返しでした。とはいえこれは悪いことではなく、良い研究ネタに出会うために誰もが一度は通る道なので、今はとにかく(読む&アイディアを出す)数をこなすしかありません。


EMNLPのレビューが返ってきたのですが、low scorerに当ってしまった模様。とりあえず、文句を言っても何も始まらないので、レビューコメント&論文の中身についてしっかりレスポンスを書いて、あとはエリアチェアの方々が論文&レスポンスに目を通してくれることを祈るしかありません。。。(今年のAAAIはエリアチェアがしっかり読んでくれたおかげでアクセプトになったので。)

May 26(Fri), 2017

新と旧と

今週からインターンが始まりました。最新のMacBookPro(新品)が支給され驚いたり、見覚え(聞き覚え)のある社内ツールがあったりと、とても不思議な感じのスタートになりました。

諸々のセットアップに加えて、プロジェクト全体像のキャッチアップをしたり、新しいアイディアのプロポーザルを書いたり、Java+Eclipse+Maven縛りでの実装(比較的簡単なタスク)を始めたりなどなど、めまぐるしい1週間でした。

一応QA関係の何かをやるということで、(自分にとっては未知の分野なので)まずはSLPと白本(質問応答システム (自然言語処理シリーズ2))を読んで、タスクの全体像や、どんな用語があるか、インプット、アウトプットは何か、典型的なアプローチは何か、など、大雑把につかみました。


どちらも良くまとまっているのですが、最初から英語で読んで理解した方が早いような気がしました。ディスカッションはもちろん、論文に出てくる用語も英語なので、英語でインプットした方が頭に余計な負荷がかからないのかもしれません。


週の後半からは少しずつ最近の論文を読んだり、アイディアを考えたりしました。最初はとにかく色々アイディアを出したり、手を動かしたりするのが大事なのかなと思っています。

May 18(Thu), 2017

春学期、終了!!

ようやくコースプロジェクトの最終レポートが完成しました。結局8ページ (+5ページのAppendix)という分量になりました。

このクラスは、Event Semanticsというややマニアック?なトピックについて3ヶ月半、小レポート(サーベイ)が2回、論文紹介2回と、プロジェクト(ロングペーパー1本くらいの分量)という内容で、Research-orientedのなかなか濃いクラスでした。

コースも終わりのんびりしたいところなのですが、来週からインターンが始まるので、慌てて荷造り&週末に移動することになります。割りと自由に研究して良いそうなので、色々と楽しみです。事前手続きをオンラインで進めているのですが、色々見覚えのある略語が(笑)。。。

そしてようやく日記が追いつきました。。。

May 12(Fri), 2017

おたがいサマー

インターン(10日後!)用にCPTの準備をしていなかったことに気づき、今日になって慌てて留学生オフィスに行ってきました。どうやらアドバイザーだけでなくDepartmentの偉い人のサインも必要だそうで、実際に発行されるのがギリギリになりそうです。3年前のインターン準備の時にも同じ手続きをしたはずなのですが、全く覚えておらず。。。う〜む、事務処理はやはり苦手です。まぁ、アメリカではそもそも事務処理が(良くも悪くも)適当なところがあったりするので、お互い様ということで。。。