Hatena::ブログ(Diary)

武蔵野日記 このページをアンテナに追加 RSSフィード

2018-06-07

ライティングスキルを上げた方がいい

ライティングスキルを上げた方がいいを含むブックマーク ライティングスキルを上げた方がいいのブックマークコメント

朝6時からメール処理。最近朝起きても疲労が残っているのだが、何でだろうか。

午前中は最先端論文紹介。

  • Aditya Grover, Jure Leskovec. node2vec: Scalable Feature Learning for Networks. KDD 2016.

これはグラフのノードの埋め込みを学習するという話。グラフのランダムウォークを用いて学習しているっぽいが、グラフの構造を考慮したいなら、マルコフ過程にするより random walk with restart にしたほうがいいような気がする。あと、近傍のノードが似たベクトルになる、というのと、構造が似ている(が近傍ではない)ノードが似たベクトルになる、というのをパラメータでコントロールできると書かれている(図がある)が、式を見てもなぜこんなことができるのか分からない……(この式では少なくとも明示的にはそのような構造は学習していないように見える)。DeepWalk や LINE というのと同じような手法で、論文の査読で必要があってこのあたりは一通り勉強したことがあるが、みんなで検討したことはなかったので、確認できてよかった。

お昼はウェブ面接の設定。2回目の接続テストも成功。しかしその後3回目の本番で失敗。マーフィーの法則でもあるのだろうか(汗)

午後は共同研究のミーティング。色々無理を聞いていただいていて、ありがたいことである。あまり研究成果につながっていないのが申し訳ないので、少なくとも今年度は言語処理学会では発表したい。

夕方は東京都教育委員会の方とミーティング。「リーディング」と聞くと最近は「リーディングシュタイナー」を思い浮かべてしまうのだが、「リーディングシュタイナー」ではなく「リーディング大学院」でもなく、「リーディングスキルテスト」について意見を聞きたい、という話である。(ちなみに自分は「リーディングスキルテスト」に関する本は読んでいないので、下記の意見は想像である)

(2018-06-14 2段落ぶん削除)

リーディング能力が必要なのは悪文を読むときで、結局社会が性善説か性悪説かという問題に帰着されるんじゃないかな。悪い人に騙されないようにリーディング能力が不可欠というのは否定しないが、限られた時間で伸ばすべき能力がこれかというと、疑問符がつく。教育的観点からはそれでは何もしなくていいのかという話になってしまいそうなので、教育的観点から考えると、伸ばして意味があるのはライティング(スピーキング)等のアウトプットのスキルで、これは少なくとも現在までの日本の初等教育、中等教育ではあまり重視されてきていないので、教育としてはライティングをやった方がいいんじゃないかな。(もちろん、ライティングのためにはリーディングがある程度できないと、という相関関係はあるので、ライティングだけでもダメだろうが)

しかし東ロボといいリーディングスキルテストといい(researchmap もそうかもしれないが)、一定のパターンがあるように思う。これが「必勝」パターンなのかな。

夜は社会人博士の人たちとのミーティング。博士後期課程の学生が増えてきたが、どのように進めていけばいいのか試行錯誤中である。

2018-06-06

研究は寝ても覚めても考える

研究は寝ても覚めても考えるを含むブックマーク 研究は寝ても覚めても考えるのブックマークコメント

午前中は古典の論文紹介で以下の論文を紹介してもらう。

  • Kevin Knight and Daniel Marcu. Summarization beyond sentence extraction: a probabilistic approach to sentence compression. Artificial Intelligence (2002).

これは文圧縮タスクについての論文で、統計的機械翻訳のようなノイジーチャネルモデルを使った圧縮手法と、構文解析の shift-reduce アルゴリズムのような決定的な圧縮手法について紹介した研究。前者も CFG を使って圧縮したりしていて、なるほどな〜という感じ。Daniel Marcu については以前の日記でも書いたことがあるが、ちょうどこのあたりの時期、寝ても覚めても文書要約の研究をしていたころなんだろうな。

お昼は臨時の学科会議。審議事項が2件だが、スムーズに終了。審議事項とは別に何か聞こうと思っていたことがあったのだが、忘れてしまった。

午後は研究会。双曲幾何(Poincare embeddings 入門)、CNN、Jupyter Notebook(を用いたニューラル機械翻訳の実験)の3本。Poincare embeddings は最初に聞いたときはとてもおもしろいと思ったが、どうもすでに存在する階層構造(辞書)を埋め込むには適している一方、自分たちのやりたいことはデータ(コーパス)から階層構造を学習することで、それはこの埋め込み方法で実現できるようには見えず、あまりおもしろく感じなかった。まあ、新しいやり方であることは間違いなく、とても独創性が高いのではあるけれど。

2018-06-05

メリハリをつけて研究する季節

メリハリをつけて研究する季節を含むブックマーク メリハリをつけて研究する季節のブックマークコメント

午前中は B3 の情報理論の授業。中間試験を前回終えて、今回から後半になったが、どうも時間配分を間違えて少し早く終わる。毎年翌年への申し送り事項をメモっているのだが、これもメモっておかないと……。

お昼休みはニューオーリンズに行っている学生とウェブミーティングというか Skype の接続テスト。今回は1週間有効な SIM を Amazon で購入して持っていってもらったが、けっこうつながるものである。

午後は進捗報告を聞く。最近の進捗報告は、時間を取って話を聞く人は max 1時間、そうでない人は10分くらいで終わっていて、メリハリがある。この時期に1時間ちゃんと進捗報告をしていると、今年度前半の論文投稿シーズンが戦えそうに思っているのだが、10分くらいしかできていないと、今年度前半は厳しいかなぁ。今年度後半に投稿できればいいのだけど。今年から無理に発表してもらうことは止めることにした(本人が発表を希望していないのに発表してもらうことも、本人が発表を希望していてもクオリティ的に問題があるものを発表してもらうことも)ので、投稿できなかったとしても特に気にしない強い心を持ちたい(研究的にはそれが最適だと思うが、教育的にはどうしても気になってしまう)。

2018-06-04

ベンチャーを起業するのも楽じゃない

ベンチャーを起業するのも楽じゃないを含むブックマーク ベンチャーを起業するのも楽じゃないのブックマークコメント

午前6時からメール処理。気温と起きられる時間に相関関係があり、寒いとなかなか起きられない(暑いとすぐ起きる)。

午前中は大学院の自然言語処理の授業。今日から自分たちがスタートアップを立ち上げると仮定して、事業計画書をプレゼンしてもらう課題を出しているのだが、その前哨戦として授業で「シリコンバレー」を紹介する。

このドラマ、シリコンバレーでスタートアップを起業するという話で、以前 Hulu で見られると聞いて見たいなぁと思っていた(見るために契約するか少し迷った)のだが、今回 Amazon Prime で見られるようになったと聞いて解説しつつ見たりする。正直際どい表現も時々あるので、手放しでお勧めという訳ではないのだが、シリコンバレーの文化を紹介するには適していると思う。(字幕と吹き替えと両方試してみたが、吹き替えのほうがいいような?)

午後はメール処理をしてから南大沢に移動し、B1 の基礎ゼミナール。ようやくグループディスカッションに入れたので、それなりに活発さがでてきてよい。日英の翻訳で Google の統計翻訳とニューラル翻訳を比較してもらっているのだが、この2つだけ見ると訳せない文にはそこまで大きな違いはなく、「ぼくはウナギだ」「象は鼻が長い」形式の文が苦手であるということが分かった。(まあ、それは苦手だろうが)

夜は基礎ゼミナールをしている教員と南大沢の職員の方々で懇親会。教職員が揃う飲み会に出たのは初めて(コースや学科の忘年会や歓迎会は、教員しかいないので)。男女比半々くらいだったが、小さい子どもがいるとこういうのに参加しにくい。まあ、若いころと違い、特に夜の飲み会に出て情報交換したいとも思っていないのだが……。日野キャンパスでも、職員の方々や生協の方々と子どもの話を立ち話したりするので、十分楽しいのであった。

2018-06-03

論文を読んで背後の著者を書く

論文を読んで背後の著者を書くを含むブックマーク 論文を読んで背後の著者を書くのブックマークコメント

今日は SEG 世界史増谷クラスの同窓会ということで、午前中は武蔵境に買い物に行き、午後は先生のお宅へ。かれこれ年に1回くらいは読んでいただいて、いろいろお話ししたりしている。

今回も新しい方の参加があり、OB/OG にしか声をかけていないのにこんなに色んな人がいるということに本当にびっくり。今回は我々以外にも夫婦、子連れで参加している世帯も2世帯あり、すごいことである。しかし子どもと一緒に過ごしたいと思ったら、本当にそのようにしないとあっという間に子どもが大きくなってしまい、あとから戻ろうとしても戻れないのだな、と思ったりする。

そういえば卒業生で今回集まった10人中、大学教員は3人(全員准教授)で、増谷先生ご夫妻がそれぞれフランス史、ドイツ史がご専門なので、教え子もファッション史、美術史の専門なのは納得だが、自分だけ自然言語処理が専門で違ったように思ったが、学部生の頃は言語政策史(科学技術史)で論文を書いていたので、遠いようで実は歴史好きだったのを思い出した。

自然言語処理や機械学習の研究をしていても、自分はどうも誰がいつどこで書いた論文か、あるいはこの論文の共著者たちがその後どうしているか、みたいなことを(手法の内容以上に)よく記憶しているのだが、これは世界史や地理の勉強で培われた能力ではないかな、と思ったりする。知識がどのように(垂直に、あるいは水平に)伝播しているのかを紐解くのはおもしろいのである。

そういえば、60歳くらいになったら早期退職して科学史あるいは技術史の研究をしたい(70歳までに科学史・科学哲学で博士号を取りたい)ので、それまで何をやりたいか考えておこうと思っている。もう一度博士論文を書くのは正直しんどいが、何か一冊、趣味で本を書くと思えば……。