Hatena::ブログ(Diary)

worldwidewug #3 このページをアンテナに追加 RSSフィード

October 09(Mon), 2017

蝿取り壺の中から

最近のプロジェクト関係で、モダリティについて色々考えることがあるのですが、結局のところ時間とは何か(言語あるいは記号でどのように表現すべきか)という問いに帰着していくことが多いです。そして、時間について考えると時間があっという間に過ぎる罠(蝿取り壺)にはまってしまい、世界そのものがゲシュタルト崩壊するような(宇宙空間に放り出されたような)感覚になります。自分の場合、哲学している時にこういったことがよく起こるのですが、ほどほどにしておかないと、そのまま戻ってこれなくなりそうです。

何が起こっているのかもう少し丁寧に表現するとすれば、ある事柄に対して、メタな視点の、そのまたメタな視点の、、、という逆方向への再帰が行われているような感じです。


彼は当選した。

彼は当選だった。

彼はあと一歩で当選だった。

彼は当選を信じている。

彼は当選したはずだった。

彼は当選できるだろう。

奇跡が起これば、彼は当選できるだろう。

彼は当選できるとは限らない。

彼は当選しないはずがない。

彼は当選した、と言われた。

彼は当選した、と騙された。


文の意味はベクトル(あるいは分散表現)だという仮説がありますが、上の例文をクラスタリングできるか試してみたいです。ひとまずRecursiveNN等でトレーニングすれば良いのかもしれませんが、リーディングスキルテストの話を聞いたり、実際にクラウドソーシングをしたりしていると、そもそも人間によるアノテーションが正しいものなのかも、怪しい気がしてきます。(むしろ、的確なInstructionsが書けるかどうか、という自分の文章力も大きな問題ですが。。。)


さらに実際のコーパスは、上のような単純な文はほとんどなく、

竹中氏は、「政策よりも、目先の総選挙で生き残ること。有権者を甘く見ているのだろうが、政策そっちのけで、新しい看板の下で戦えば、自分は当選する。小選挙区では大政党が有利なので、まず、政治家のポジションを確保しなければ、政策は出来ない。

当選するために、手っ取り早いのは、風が吹きそうな"希望の党"にジャンプしてしまう」と指摘しました。

https://news.yahoo.co.jp/byline/kudoyasushi/20171010-00076746/

のように出てくるので、頭を抱えてしまうわけです。


意味に関する問題はモダリティに行き着き、それは時間(+空間?)の概念とは切っても切れない関係にあるような気がします。

やはり自然言語の闇は深いです。最近流行りのキャプション生成・画像生成などはまだかわいく思えます。上の抜粋記事から画像を生成したら、どんなものが出てくるのか、少なくとも静止画ではなく、動画のような「時間関係」「因果関係」を持つフォーマットが必要になる気がします。

きっとシンギュラリティのようなものが来たら、答えがわかったりするのかもしれません。そうであれば、早く来てほしいものです。


と、あれこれ考えたりしていますが、考えてばかりでは何も生み出せないので、しっかり手を動かし続けたいと思います。


問:上の抜粋記事から、「希望の党に入る -> 当選する」と結論づけられるか。

  1. Yes
  2. No
  3. どちらとも言えない

October 03(Tue), 2017

CNNへ入門

今日はMichael Auli氏のトークでした。

例によって1on1でミーティングをしたのですが、とても気さくでいい方でした。技術的な話はもちろん、FB Researchの中の話も聞けて、大満足でした。そして(食わず嫌い気味だった)Convolutional NNに入門することに。

こんな感じでホットな研究者とほぼ毎週1対1でじっくり話せるCLSPの環境は素晴らしいです。

自分の人生の目標の一つに、「良い研究をして、いつかCLSPでゲストとしてトークすること」が加わりました。

October 01(Sun), 2017

継続は力なり

明日が誕生日ということで、週末のうちに我が家のお気に入りの(近所の)レストランでブランチをしてきました。

さすがに5年も住んでみると、Baltimoreの(リーズナブルで)美味しいお店が色々とわかってきます。もしくは単に味覚が変わってきているのかもしれません。一つ確実なのは、来た当初は多すぎて食べ切れなかったアメリカンサイズを今ではペロッと(しかもデザート付きで)平らげることができるようになっているということです。何事も継続は力なり、ですね。


ということで、今年は体力・持久力のアップと健康維持を抱負にします。

September 10(Sun), 2017

論文の密度

今週は論文締め切り前ということで、実験したり論文を書いたり。

今回はロングペーパーを書いているのですが、このままだとロングでも収まりきらないので、なんとか圧縮しなければなりません。。。短編(ショート)なら、ある程度良いもの(*ACL系の会議のReviewの平均が4以上)が書けるようになってきた(より正確には判断ができるようになってきた)のですが、長編(ロング・ジャーナル)は、いかに読者を飽きさせないかという点で、やはりShortよりは難易度が高い気がします。ただ世の中には退屈なロングペーパーも少なくないので、そこまで気にしなくても良いのかもしれないですが、冗長だったり、take home messageの密度が低い論文(本来Appendixに入れるような内容が本文にあるもの)はあまり書きたくない*1ので、締め切り直前まで頑張りたいと思います。もちろん、個人の好みと言ってしまえばそれまでですが、そういうこだわりやスタイルみたいなもの(ある意味ではバイアス?)も少しずつ出せるようになってきました。

*1:クラシックで言えば、ブラームスの楽譜のような濃厚なものが好き

September 04(Mon), 2017

(最終年だなんて)ご冗談でしょう、keisksさん

今学期は春にやり残したプロジェクトを進めつつ、各所へアプリケーションを書いたり、博論を書いたりすることになりそうです。春にやり残したプロジェクトはさらに2つのサブ論文に分裂しそうで、インターン中の話(1本か2本)、現在のプロジェクト、そしてもうひとつラボメイトと進めているサブプロジェクトも進んでおり、博論や就活に支障がでないかどうか心配になってきました。


(3年前に卒業した)ラボの先輩が立ち上げたスタートアップがBaiduに買われたそうで、大分リッチになったそうです。母校への恩返しということで、毎週のセミナーのランチ代を4年間出してくださるそうで、、、こういうサイクルで、また次の世代が育っていくのでしょうね。ご縁があって、youもスタートアップしてみないかという話があったりしたのですが、そもそも選択肢として考えていなかったので戸惑ってしまいました。ただ、良くよく考えてみると、「自分は(自然言語処理で)世の中のために何ができる・したいのだろうか」という問いに行き着き、自分の研究に対する姿勢なり覚悟なりが問われているような気がしました。

ということで、これも何かの縁ということで、起業するとはどういうことか、考えてみたいと思います。(自分が起業するかどうかは別として。)

研究(特にサイエンス)と利益(お金)の追求は両立するのだろうか。。。というのが今の素直な疑問です。


August 30(Wed), 2017

新入生がやってきた

去年先輩方が多く卒業していったせいか、今年は何だか例年より若干多い(しかも留学生率が低い)気がします。

例によって自分は顔と名前を覚えるのに時間がかかってしまうので大変です。

実はOpen campusの日に、自分がセミナーで発表していたこともあり、新入生から「あのときトークしてた人ですね。面白かったです。」と言われて、嬉しいやら恥ずかしいやら。(逆に、つまらないと思った人はおそらく他の大学に行ってしまったのではないかと気づき、恐ろしい気持ちになりました。。。)

自分としては研究自体も発表スキルもまだまだ改善していきたいところがたくさんあるので、引き続き精進あるのみ。

August 18(Fri), 2017

Welcome Alexa

前々から気になっていたFire TV stickが我が家に届きました。

妻がさっそく試しているのですが、Ok, Googleとか、Hi, Siriとか、Microsoft製品は好きか? など、困らせることばかり聞いています(英語で)。そしてAlexaが回答に困っている。。。


さて昨日の心温まるメールに引き続き、アドバイザーから「これ読んだことある?」とダニエル・カーネマンの論文(行動経済学)を紹介されました。

偶然というかなんというか、自分が理研のパートタイマー(リサーチアシスタント)だった頃に一通りサーベイした分野だったので、そのことを伝えると「それは良かった。自分もこの分野に興味があって、一時はComputational PhilosophyでPh.Dを取ろうとまで思ったんだよね」とのこと。今までも薄々(?)感じていましたが、完全に研究の興味対象がオーバーラップしています。NLPはもちろん、心理言語学や言語哲学の話題でも一緒に盛り上がれるし、本当に良い先生に巡り会えたなと思っています。


就職先を選ぶ際にも、(給与や会社の規模ももちろん大切ですが)「誰と一緒に何の研究をするか」が自分にとっては重要な気がします。よりメタな視点としては、

を自分も心がけたいなと思います。