Hatena::ブログ(Diary)

武蔵野日記 このページをアンテナに追加 RSSフィード

2017-12-31

少しずつ助走をつけてジャンプする

少しずつ助走をつけてジャンプするを含むブックマーク 少しずつ助走をつけてジャンプするのブックマークコメント

大晦日であるが、朝は言語処理学会年次大会と卒論の原稿を添削したりする。朝の時間くらいしか使えないので、年内に送ってもらったものを返すまではやるしかない。

お昼にお見舞いに行ったりする。当たり前であるが、入院していると年末年始も関係なく人がいるのだなあ。(人手が足りなくなるから面会できないとか言われるのかなと思っていた)

毎年大晦日は1年の振り返りをしているので、今年も。

1-3月

  • 研究室で2回目の修士の学生を輩出するが、修士論文を出す学生が7人もいて、かなり厳しかった。新入生の面倒を上級生が見たり、お互い原稿の proofread はしてもらうことにして、だいぶうまく回った。来年以降もこれを定番とすることに。
  • 言語処理学会年次大会に10本投稿し、その勢いで ACL の short paper に9本投稿して、研究室的に新しいフェーズに突入した。結局 short paper は1本も通らず、研究室の戦略(英語で論文を書いて投稿できればいい、というポリシーで、期待値的にときどき通るのではないかと楽観的に考えていた)を大きく転換する契機となる。
  • 筑波大学で開催された言語処理学会年次大会に1日だけ参加するも、ACL の author response をひたすら準備して、それに関して学生と打ち合わせしただけという、なんとも意味のない参加の仕方をした。国内学会との付き合い方を考えるきっかけになる。

4-6月

  • 研究室に新入生を迎え、研究生を入れると総勢25人(入れないと23人)という過去最大の人数になる。物理的に座席が足りなくなったので、研究生はシェアしてもらう。前期は基礎勉強会がメインなので、人数が多くてもそんなに不都合はないのだが、後期は厳しい。
  • 査読あり国際会議に投稿して不採択で、書いたのが卒業生なので査読のコメントで追加実験を要求されても対応できない、あるいは内容的に旬を過ぎてしまって、ちゃんとした国際会議に通すのは難しい、と判断した論文について、arXiv で公開する。今後も積極的に arXiv を(研究を宣伝する場所というよりは、論文を埋もれさせないために)活用していきたい。
  • 今年で今年度までに引き受けた仕事は全部なんらかの形で終わらせることを心に決め、4月以降は積極的に新規の仕事を断る。ひとまず仕事の負荷を下げないとどうしようもないので、自分の時間をどう使うか、ということを今まで以上に意識する。

7-9月

  • 自然言語処理の主要な国際会議(EMNLPとIJCNLP)の NLP Applications の area chair の仕事をする。以前 ACL の同じ分野の area chair はしたことがあるが、2つの学会の area chair を同じ年にするのは初めてで、ちょっと大変だった。これからは年に1つ(先に依頼が来た方)にしたい。
  • 修士の卒業生たちの修士論文を論文誌に投稿しようとしていたが、結局全員断念する。就職してしまうと時間がなくなることはもちろんのこと、一気にモチベーションが下がるし、可能な限り在学中(理想的には修士論文発表会より前)にケリがつくようにしたい。
  • 研究室初めて、博士前期課程の大学院入試で定員を設定し、かつ定員を超える人数が大学院に合格したので、定員オーバーということで合格者の進学を断った(うちの研究科は合否と研究室配属は別で、かつ研究室配属に内部生か外部生かも関係ない)。現在の制度上、内部生でも進学できないのは仕方ないが(東大や東北大など、他大学ではときどき聞いていたが)、断る方も胃が痛い。

10-12月

  • 研究室インターンシップで B3 の人たちと議論しながらアノテーションをしてもらう。2年前の経験から、やる気のある人が来てくれるならこれが一番いい。言語処理学会年次大会でも発表予定。
  • 情報処理学会自然言語処理研究会(NL研)の幹事業務を終え、国内の学会の主な仕事から引退する。今後は投稿も学会運営への貢献も、国際会議(学会)での活動を重点的にやっていきたい。
  • 言語処理学会年次大会で10本ほど投稿希望があり、添削祭り。昨年同様、在学生が新入生の面倒を見る形にしてもらい、ちゃんと在学生に見てもらっている人はしっかり書いてきていて大変助かった。理由は様々だが、メンターとの連携がうまくいっていない場合が今後の課題。

去年の感想とほぼ同じだが、仕事を断ることで時間を捻出し、現在引き受けている仕事の質を上げることに費やした1年だった。残念ながら継続が多く量はほとんど減っていないが、新規に引き受けないことで生まれたわずかな時間でこれまで積もりに積もっていた仕事を(ネガティブな結果でも)少し前に進めることができた。引き受けている仕事も量が変わっていない以上、劇的な質の向上は見込めないが、質を上げようという意識で取り組むことで、自分のものの見方が少し変わった。もう1年継続して取り組むことで、新しい境地に到達したい。

2017-12-30

到着の順に返事を返す冬

到着の順に返事を返す冬を含むブックマーク 到着の順に返事を返す冬のブックマークコメント

昨日が京都出張だったので、今日から冬休みである。

とはいえ、昨日の新幹線の中でやるはずだった言語処理学会年次大会の原稿(第1稿)の添削があるので、朝から昼まで時間をもらって5件返す。初稿だと、大体1本あたり1時間かなぁ。

今年からは、基本的に到着順にキューに入れて見ることにしていて、かつ遅れた人は本来〆切の順番で見るのではなく、遅れた人も到着順に見る(それによってクオリティが上がり切らなかった場合は、投稿を見送る)ポリシーに変えた。というのも、遅れて出す人のために〆切を守る人が不利益を受けるのはおかしいということで、遅れて出すのは別に構わないが、それによる不利益は遅れた人が負担すべき、という考えからである。(自分自身、〆切を守れないこともあるので、〆切を守らないこと自体では特に責めたりしたいわけではない)

小規模な研究室だからこそ、あまりうるさいことは言わず柔軟に対応できることがメリットなのだが、スタッフと学生の比率を考えると、うちの研究室は自然言語処理分野の中でも突出している(うちより学生数が多いところは、スタッフが2名以上いる)と思うので、できなくなってしまったことも多いのが少し残念。今年度は発表件数を減らして(他の研究会等と分散させて)質を上げることにしたが、これが吉と出るか凶と出るか、来年にならないと分からない。

2017-12-29

何年も同窓会が続いてる

何年も同窓会が続いてるを含むブックマーク 何年も同窓会が続いてるのブックマークコメント

朝から新幹線で京都へ。年末年始の帰省ラッシュで全然座席が取れず、指定席はおろかグリーン車でも満席が続いていてびっくり。ようやく取れた座席だったが、グリーン車の雰囲気が違って、ほとんど指定席状態であった。

時間がないので車内でお弁当を食べようと思って買っていたのだが、殺伐としていて食べる雰囲気ではなく、京大まで持ってきてしまった。心優しい [twitter:@eiennohito] さんが黒橋研究室に案内してくれたので、助かった(そういえば、Twitter ではつながっていたが、実際に会うのは NAIST にいたときにお会いしたきりだったかもしれない)。[twitter:@murawaki] さんも来てくれて、いろいろ話したり。

黒橋研、京都のそれなりにいい場所にあるのに、学生のスペースが広くていいな〜。うちも、研究室に学生が10人程度だったころ(2年目)はスペースがあってよかったのだが、今はぎゅうぎゅうである。授業期間でなくなったら、ちょうどそれくらいの人数になるのだけど。

午後は 第9回入力メソッドワークショップ。かれこれ9年も続いているが、入力メソッドに関する OB/OG の同窓会のようなものである。商用のもの、オープンソースのもの、研究的なもの、いろいろ含めてずっと続いているのはすごいなと(自分で続けておいて)思っている。まあ、純粋に入力メソッドに関する発表は、完全少数派なのだが、NAIST 松本研も毎年夏に「SVM 勉強会(SVM 合宿)」と題して SVM とは全然関係ない同窓会を開催しているので、それと同様のノリである。

今回は飲み会には参加できなかったが、昼の部のトークがいろいろ豪華で、たくさん楽しい話を聞くことができてよかった。そういえばうちの研究室でも誰か入力メソッドに関する研究をしてもいいかなと今さらながら思ったのだが、ニューラル日本語入力を来年の B4 の研究テーマの一つにしようかな?(先頭から順番に変換する必要があるということと、分からなければ最悪ひらがなやカタカナで出すというアクションがあるので、普通の sequence-to-sequence ではないのだが、どこがどう違うのかはもう少し調べてみたい)

帰りの電車の中でも少し言語処理学会の原稿を見ようとしたが、修士論文の副査の仕事が多すぎて、たどり着かなかった……。

2017-12-28

センターの監督員でうろたえる

センターの監督員でうろたえるを含むブックマーク センターの監督員でうろたえるのブックマークコメント

午前中はオンラインで Google Hangout を使って B3 の研究室インターンシップのミーティング。授業日的にはもうやらなくていいのだが、言語処理学会年次大会までの残り時間を考えると、この日にみんなで集まって相談する必要があったのである。10,000件のアノテーションをみんなで確認するのだが、時間内に終わらなかったので、また年明けにオンラインで集まることに……。みんなよく集まってくれて、ありがたい。

昼から出勤してセンター試験の監督員向けの講習会を受ける。出欠もチェックされているので休めない。今年は土日の両方が当たっていて、特に日曜日は夫婦ともにセンター試験の監督員になっているので(かつ、母が入院中なので)、どうしよう、と思って右往左往する。

午後は年内最後の進捗報告を聞く。研究の着地点をどういうふうにするか、考えながら進めないとな〜。

夕方は南大沢キャンパスに移動して、首都大 KIDS という一時保育施設に申し込みをする。まず大学に申請をして、受理されたら保育園で面談をして、面談の結果 OK ならそこから利用できる、という流れのようである。センター試験の日も保育をしてくれるというので、とりあえず申し込んでみる。保育のオプションがあることだけでもありがたいのだが、センター試験の集合時間に間に合わない時間に保育が始まっているのが気にかかる。これどちらかがもう片方を考慮してくれないと、意味がないのではないか?

夜は保育園の忘年会。娘の仲がいい同級生の男の子が1人転出予定(兄が小学校に入るのに合わせて、自宅の近くの認可に移る)と聞いていたが、同じく娘と仲がいい同級生の女の子が母の仕事の都合で引っ越しで転出予定だそうで、びっくりする(ちなみに、父は現在より職場が遠くなるという話)。小学校に入ると動きづらくなるし、この時期に移動する方がいいのかもしれないが、人生いろいろだなぁ。「昭和51年の会(昭和51年生まれの親の会)」も健在で、盛り上がっている。自分は昭和53年生まれなので、若手だった(汗)

2017-12-27

年末に進捗をする秋葉原

年末に進捗をする秋葉原を含むブックマーク 年末に進捗をする秋葉原のブックマークコメント

今日は首都大秋葉原キャンパスにて共同研究のミーティング。地方から来る方々にご好評の立地で、よかった(東京駅から1駅だし、駅前だし)。いわゆる文系の人、名古屋や大阪、仙台くらいの立地だと、東京に住んでいる人も珍しくない(授業や会議のある週3日ちょっとしか出勤しないとか)ので、そこまで関係ないかもしれないのだが(いつもは立川の国語研でミーティングをやっているし)。

今日の議題は我々が作成中のシステムに関する進捗報告で、今年度が最終年度なのでさすがに年貢の納めどころかと思って、在学生に手伝ってもらって作っているのである(これまで機械学習部分は自分が数ヶ月に1回くらい手を動かしていた)。現在は学生に恵まれてサクッと作ってもらうことができて、大変ありがたい。というか、こんな薄給で作ってもらってよかったんだろうか(一応、論文が書けるというメリットはあるが)。

しかし、今年度で終わりだと思ったから焦って作ったので、1年延長する申請をするという話で、それならこんなに急がなくてもよかったのに、と思いつつ、最初から延長すると聞いていたら焦らなかったと思うし(そうしたら、完成していなかったかもしれない)、これはこれでよかった。

ドキュメントを少し書かないといけないのだが、こういう細々とした仕事に時間が使えるのは2-3月だなあ……。もう全然時間がない。

2017-12-26

ステップを飛ばしてないか、まだ不安

ステップを飛ばしてないか、まだ不安を含むブックマーク ステップを飛ばしてないか、まだ不安のブックマークコメント

午前中は年内最後の修論・卒論の進捗報告。いつも言語処理学会年次大会の進捗報告と同時進行なので慌ただしい。まあ、最近は修論の質も安定してきて、長さも大体同じになったし、クオリティも(少なくとも1本は査読付きの国際会議に通している学生たちになってきたので)上がってきて、自分がすることはあまりないのだけど。ただ、卒論に関しては、今年から全員を言語処理学会年次大会で発表してもらわないことにした(国際会議に投稿できるような内容でないなら、投稿が集中する年次大会以外に回ってもらうことにした)ので、多少この時期にも見ないといけない(3月以降に投稿するにしても、卒論の発表会やその予稿の提出は2月なので)。

午後は共同研究の打ち合わせ。色々と組織が変わると大変そうだなという印象だが、多分自分も外から見たら(来年度に改組するので)同じではないかと思ったりする。アウトプットがコンスタントに出せたらいいのだが、なかなか難しい(うまくいって2年に1回くらいではないか? と思うと、1年以下の共同研究ではほとんど成果を挙げられない)。

夕方は博士論文の審査会。今年度は初めての主査をしているのだが、色々と分からないことが多くて心配である。どの順番で審議していかないといけないか、とか。博士論文の審査委員会はコース会議、コース長会議、教授会の順番で審議して設置が承認される一方、審査報告は公聴会のあとコース会議で承認されたら、コース長会議を経ずに直接教授会にかかる。

自分は大学院教務委員を2年間やったし、最後は1年間委員長だったにも関わらず、ちゃんと把握できていなかった(一応、博士の学位審査に必要な手順で明文化されていなかった手順は自分の委員長の間に明文化して改善したはずだが、それでも「書かれていないこの手順は書かれていないのか存在しないのか」がすぐには判断つかない)。ややこしい。

というわけで、[twitter:@moguranosenshi] くんの公聴会の情報は以下。

  • 時間: 2018年2月8日(木)16:30-18:00
  • 場所: 首都大学東京日野キャンパス2-302
  • タイトル: Text Simplification without Simplified Corpora(平易なコーパスを用いないテキスト平易化)

講演および質疑は日本語で行われる予定で、どなたでも参加可能なので、興味のある方はどうぞ。

2017-12-25

学生が少ないうちはできたこと

学生が少ないうちはできたことを含むブックマーク 学生が少ないうちはできたことのブックマークコメント

午前中から、言語処理学会年次大会に向けた今年最後の進捗報告を聞く。今年は10件程度の予定(小町の負荷軽減のため、すでに2件断念してもらったが)。

秘書さんの出勤日だったので、お昼はスーパー事務処理タイム。毎年知見が得られて効率化されているはずなのだが、いろいろ会計の罠(合算使用できるとかできないとか、あるいはこれはこの予算からは出せないとか)があり、厄介。

午後はクリスマスケーキを買ってきたので研究室内でプチクリスマス会。以前は自宅に研究室メンバー全員を招待していたのだが、もう招待できる規模ではなくなったので、なんとなく今年は調整すらしていなかったのだが、それはちょっとなー、と思って。

夕方はカリキュラム委員のお仕事。教職関係の仕事は大体終わったと思うのだが、毎年この時期は色々あるなぁ。

2017-12-24

クリスマスイブにたくさんプレゼント

クリスマスイブにたくさんプレゼントを含むブックマーク クリスマスイブにたくさんプレゼントのブックマークコメント

午前中、ちょっとお仕事で駅前の喫茶店まで行かせてもらう。土日や祝日は仕事するにしても、移動時間がもったいないので、大学には行きたくないのである。

1ヶ月前のことになると、何をしたのかさっぱり思い出せない。

夕方はお見舞いに行き、クリスマスプレゼントをもらう。娘(3歳7ヶ月)はサンタさんという存在を明示的に言っていないのだが、ミッキーマウスにサンタさんが出てくるし、スポンジボブにもサンタさんが出てくるので、サンタさんという概念は把握してそうだが……。

ちなみに、実家はクリスチャンだったが、クリスマスは特にサンタが来るイベントやプレゼントがもらえるイベントではなく、お年玉と同額のお小遣いがもらえるイベントであった。(クリスマスイブとクリスマスに、特に違いはなかった)

2017-12-23

3歳になってようやく初セリフ

3歳になってようやく初セリフを含むブックマーク 3歳になってようやく初セリフのブックマークコメント

今日は娘(3歳7ヶ月)の通う保育園のお楽しみ会(お芝居などのお披露目会)。娘が参加するのはかれこれ3回目で、0歳、1歳および2歳のときはセリフもなく歌に合わせて踊るだけ(0歳のときは本人が踊るのでもなく、保育者さんに抱かれてただけ)だったが、今年はセリフつきでお芝居をしていて成長を感じる。3歳児5人の中では2番目に長い出番で、かなりしっかり演じることができていて、家での甘えんぼぶりからすると別人のようである。

お昼は全員でご飯を食べるが、好きな男の子の隣に座りたいと主張し、その子の母を押しのけて座ったり(汗)なんか、娘が一方的に好きなようで、若干嫌がられているようだが……(不憫)。

夕方は [twitter:@mizuno_takaaki] さんご家族と三鷹でディナー。前回は我が家まで来ていただいたので、交互にそれぞれの家の近くに来ている感じ。お子さんが少し年上なので、子育てや教育(観)についてお話しを聞いたり、海外での仕事のお話しをお聞きしたりする。子育ては色々考えることはあるのだが、ひとまずそろそろ土曜日あたりに習い事を始めてみるといいのかなぁ。

自分はいつも少し上の世代の方々に時々相談に乗っていただいて、いろんな境遇で頑張っている人たちや、同じ状況でも違うものの見方があることを知って、知らなかった〜、と世界が広がる感じ(例えば、自分は海外で単身赴任するなんてこと、考えたこともなかった)。いつもお付き合いいただいている方々に、感謝感謝である。

2017-12-22

リザルトが悪いときこそおもしろい

リザルトが悪いときこそおもしろいを含むブックマーク リザルトが悪いときこそおもしろいのブックマークコメント

午前中はパターン認識と機械学習の授業。どうも去年と比べて話せることが少ないな、と思っていたが、どうやら今年度は昨年度と比べて1コマ分少ない(去年は8コマあったのが7コマしかない)ようである。そりゃ話せることが少ないわけだ……。

午後は機械翻訳勉強会。言語処理学会年次大会に向けて色々と実験結果が出てきていておもしろい。実は機械翻訳組はいま negative result が過半数なのだが、negative でも何か突破口が見つかれば一気に解決しそうな感じ(研究者としての直感)で、(やっても見込みがなさそうな場合もあるが、今年はダメそうなケースはかなり手前の段階で方向転換してもらっている)ここは耐えてコツコツと色々実験していってほしい。

2017-12-21

研究会幹事でわしも考えた

研究会幹事でわしも考えたを含むブックマーク 研究会幹事でわしも考えたのブックマークコメント

今日は NL 研には行かずに日野キャンパスに出勤。

2限は B3 の研究室インターンシップ。言語処理学会年次大会に投稿することになったので、ペース配分を決めて淡々とアノテーション・議論・分析をしつつ、原稿も進めていく。

お昼休みは B3 に向けた研究室配属のための研究室公開。木曜日に必修の授業があるので一番参加者が多い。来年度は木曜日に2回開催しようかな。伝えたいことはだいたい研究室のウェブサイトに書いてあるので、それを見てくれればいいのだが、大学院まで含めた3年間でトップカンファレンスに挑戦したい、という人にうちの研究室に来てほしいと思っている(従って、英語の論文をたくさん読んだり自ら書いたりしたくない、という人は、可能な限り他の研究室に行ってもらいたいのである)。

午後は教授会。博士論文の審査会設置のためには今年度は今月の教授会が最後なので、学部教授会はともかく大学院教授会が長い。先月済ませておいてよかった。

夕方は準備教授会。来年度は「準備」教授会ではなくこちらが正式な教授会になるわけだが、来年度以降もしばらく夕方の時間になるのだろうか……(南大沢キャンパス所属の教員もいるので、仕方ないが)

夜は準備学科会議。木曜日は会議・会議・会議で雲散霧消してしまう。今回の学科会議ではうちの研究室としては good news があったのだが、休みなしに連続なのでヘトヘトである。

会議が終わってから都立大学駅に移動して情報処理学会自然言語処理研究会の幹事団の慰労会。現主査と新主査、そして現在の幹事団が集まって「存ぶん」というお蕎麦やさんですき焼きをいただく。自分は1時間遅れで行ったので1時間くらいで解散かと思いきや、自分の予想した終了時間からさらに1時間あり、色々お話しをしたり。

[twitter:@hitosh_ni]さんに「小町さんが動画配信を続けるべき・自然言語処理コミュニティの多様性を確保すべきだと思うのはなぜですか?」と聞かれ、そのときは答えが(自分にとっては自明だったので)うまく答えられなかったが、自分の考えをまとめると、マイノリティを意図的にも意図しなくても排除するような組織は(うまく行っているときはそれでよく見えても)長期的には脆弱で、数十人の内輪のグループにまで情報保障をする義務があるとは言わない(そのためのオーバーヘッドを負担することに耐えられない)が、日本の自然言語処理コミュニティほどの規模(1,000人単位)の組織であれば、ある程度のマイノリティに対する配慮は義務(オーバーヘッドは当然発生するが、それは必要なコスト)ではないかと思っている、ということかな。

結局自分がマイノリティかマジョリティかというのは相対的なものだし、かつ立場を変えれば同じ人がマイノリティにもマジョリティにもなりうるので、自分がいまマジョリティ側にいるからいい、というものではなく、可能な限りマイノリティが不利益を被らないような社会にしたいと考えている。もちろん、無限にやればいいというものではなく、費用対効果を考えなければならない場合もあるだろうが、学会という組織を運営する(それまでのフォーマットを踏襲する)ための技術的負債のようなエフォートを使うくらいなら、現在のコミュニティとしては不要な仕事を減らし、今日必要な業務に時間を使った方が有意義ではないか、ということである。

そこまで伝わった上で改めて思うのは、いま日本で自然言語処理の研究をするに当たって、イベントに現地参加できることが前提で学会コミュニティが成り立っているのは効率が悪いと思っていて、様々な理由で現地参加できない多数の人がいるし、現地参加できなくてもコミュニティの活動がスケールするような形にしておいたほうがいいのではないか、と思うのだ。(ただ、この論点を話しても、50代以上の世代にはほとんど理解してもらえていない気がする)

自分に関しては、日本国内の主要な学会活動(プログラム委員、編集委員や幹事としての学会運営業務)はほとんど終えたと思っているので、これからは一参加者として研究を楽しみたいと思う。

2017-12-20

長く続けてればいつか報われる

長く続けてればいつか報われるを含むブックマーク 長く続けてればいつか報われるのブックマークコメント

今日は第4回自然言語処理シンポジウム(情報処理学会第234回自然言語処理研究会=NL研)参加のために早稲田大学へ。かれこれ任期2年を2回、合計4年の研究会の幹事業務に従事してきたが、今回が最後でお役御免である。

朝に会場に行き、会場係の早大の菊池さんと雑談をする。もともと自分が自然言語処理の道に入ったのは、3回目の留年で暇になり、大学の先輩の紹介で国立国語研究所のプログラミングアルバイトを始めたことがきっかけなのだが、そこで従事した仕事は「日本語話し言葉コーパス」の XML 作成で、前任者の(Perl)スクリプトを引き継いで完成させるのが仕事だったのだが、それぞれの元のデータがどういうデータか知らないと作業できなかったので、韻律データに関する相談をよくしていたのである。その後自分も NAIST に進学し、こうやって学会で再会するとは当時思ってもみなかったが、自分は色々と運に恵まれた(節目節目で色んな人に引き立ててもらってきた)のだと思う。

東京に来て企業の人からの相談がすごく増えました、というお話をしたところ、菊池さんのところも10年以上前からずっと対話の研究をしていたが、不遇の時代が長すぎて、こんなに問い合わせがあるのはここ数年の話ですよ、と教えていただいた。確かに自分も NAIST にいたころ、対話の研究には関わっていなかったし、東京に戻ってきてからも(ニューラル生成がそこそこ使えることが分かるまで)積極的に手を出すのはためらうテーマだったので、状況はよく分かる。

あと、うちの研究室にも早稲田出身の学生がいた(いる)し、毎年のように受験希望者がいるが、早稲田は色々エネルギーのある人が多くていいなぁ(正確には、エネルギーのある学生が一部にいる、ということかもしれないが)。

最初のセッションは岡山大の竹内さんがいつも通り質問されていて、月並みながらすごいなぁと感服する。NAIST 時代も含め、いろいろな大学教員を見てきたが、教授陣と准教授陣が明らかに異なるのは研究ど真ん中の発表に対するコメントの鋭さではなく、分野が外れていたりしても、あるいは少しトリッキーな発表でも、ちゃんと研究の文脈で本質的な(建設的な)質問なりコメントなりができることだと思っていて、竹内さんの質問はいつも参考になる。自分はまだまだだと思うことしきり。

NL研は我々が担当の最後の動画配信。どうも Mac の PowerPoint で配信がうまくいかないという問題があったのだが、デフォルトではプロジェクタをつなぐと(発表者ツールのアイコンをクリックしなくても、スライドショーにしたら)発表者ツールが常に起動されてしまうというのが原因だった。「環境設定」→「出力と共有」→「スライドショー」から「2つのディスプレイを使って発表者ツールを常に起動する」のチェックを外せばいい。本当に勘弁してほしい。

昼休みは運営委員会。特に特筆すべきことはないが、動画配信を来年度以降もぜひ続けてほしい、という意見を表明しておいた。そこそこ配信が手間なので、配信に価値を置くかどうかが続けるかどうかの判断に関係するのだろうし、もし配信の継続を希望する人は、来年の言語処理学会年次大会のワークショップ言語処理研究者・技術者の育成と未来への連携などで NL 研の主査にフィードバックしてほしい。

午後のセッションでは、これで最後かと思っていくつか質問をしてみたり。これまでは動画配信のときはほとんど動画にかかりきりだったので、ほとんど質問をする余裕がなかったのだが、割と余裕ができた。そういえば NL 研は昔は松本先生がほぼ毎回参加されて、前の方の席に陣取り、たくさん真摯な質問をされていたので大変よかった、という話を時々聞くのだが、自分も一参加者の立場になって参加するようになったら、そのような研究者になりたいと思っている。

2017-12-19

自分から動ける人に来てほしい

自分から動ける人に来てほしいを含むブックマーク 自分から動ける人に来てほしいのブックマークコメント

午前中は論文紹介を欠席させてもらい、メール処理。今週は NL 研など色々あって仕事のできる時間がない。

昼から進捗報告を聞くが、1時間では全然終わらない。博士の学位論文審査の練習も聞くが、少ししかコメントできず、申し訳ない。

午後は共同研究の打ち合わせ。長くお付き合いいただける企業はとてもありがたいが、昨今どこも企業内の状況が変わっているそうで、研究テーマは時代時代に合わせて変えないとな、と思ったりする。同じ仕事がしたいなら転職(会社を変えること)も辞さないつもりでないといけない、同じ会社に居続けたいなら業務が変わることも辞さないつもりでないといけない、というのと似ている。ちなみに自分は仕事自体に特にこだわりはない(それがどんな小さなことであれ、日本に閉じておらず、国際的に意味のあるような仕事をしたいとは思っているが)。

夕方は南大沢に移動して国際副専攻委員会に出席。自分の所属する情報科学科も平成31年度入試から国際副専攻(英語力のウェイトが高い AO 入試で、入学後の留学が義務)に参加することになっているが、どういう学生が応募してくれるか楽しみである。これから大学入試が大きく変わる節目に当たっているので、色々様子見をした方がいい局面、逆に一緒に(あるいは先取りして)変えた方がいい局面、両方の考え方があるのだが、行動力のある学生が来てくれるように変えていきたい。

2017-12-18

年末に倫理審査の申し込み

年末に倫理審査の申し込みを含むブックマーク 年末に倫理審査の申し込みのブックマークコメント

午前中は論文紹介を聞く。論文紹介のスライドは原則公開してほしいと伝えているのだが、公開してくれない人が多いなぁ。今後就職活動する人には、公開するデメリットよりメリットの方が大きいと思うのだけど。来年度から、修士の学生のスライド公開については、ある程度の強制力を働かせようかなと思っている。(博士の学生はスライド公開するもしないも自由だし、学部生はそのまま進学しない人もいるので仕方ない)

午後は進捗報告を聞く。前後に予定が入っているとあまり時間が使えないので、人数が多いと厳しい。

夕方は統計数理研究所に行き、共同研究のミーティング。倫理審査の書類を揃えたりするが、申請するのはそこそこ大変。まあ、一度やったことがあれば、ルーチンワークでもあるが……。

2017-12-17

いざというときに備えて冗長化

いざというときに備えて冗長化を含むブックマーク いざというときに備えて冗長化のブックマークコメント

夕方は娘と2人でお見舞いに行く。今週からリハビリテーション専門の病院に転院したせいか、子連れで病棟に上がれなかったので焦ったが、なんとか電話で連絡を取って会えてよかった。

夫婦ともに仕事があるとき、これまでは実家にお願いしていたが、そうできなくなったので、病児保育のフローレンスに申し込もうとしたら、なんと登録待ちなのか〜。とりあえずハニークローバーというのに登録してみたが、どうなんだろう。病気なら夫婦のどちらかが休んだ方がいいような気もする。

土曜日は一応1週間前までに言えば娘の保育園でも対応してくれるのだが、日曜日はいかんともし難いし、もう少し育児を多重化・冗長化しておかないとなぁ。

2017-12-16

ブランコでパパに押されて上機嫌

ブランコでパパに押されて上機嫌を含むブックマーク ブランコでパパに押されて上機嫌のブックマークコメント

午前中は娘(3歳7ヶ月)が温泉に行きたいというのだが、近所のスーパー銭湯は改修工事中なので、東久留米のスーパー銭湯まで足を伸ばす(2回目)。かき氷が食べたいというので食べるが、どうも冬にかき氷はよくないのではないか?と(今さら)思ったりする(1つ注文して、8割くらい自分が食べるのだけど)。

夕方、「鳩ぽっぽ公園に行きたい」と言うので2人で出かける。真冬なのに超薄着で、いつも下は短パン、上は長袖1枚に薄い上着、という出で立ち。去年もずっと短パンだったので下は諦めているが、上はもう少し暖かくした方がいいのではないか?と思ったりする。

公園に来ていた女の子たちとブランコで遊んだり、平均台で遊んだり。社会性が出てきたなと思ったりする。その子たちは近所の幼稚園に通っているそうで、文化圏の違いを感じたりするが……。

あと、父がどうも自分と同じ時期に(1歳違い)同じ幼稚園に通っていたそうで、びっくりする(小学校は別)。まあ、地元で遊ばせているとそういうこともありうるが、幼稚園の記憶が(1年半しか通ってないし)ほとんどないので、同級生だと言われても(小学校が一緒でない限り)全く分からない自信がある。そっちのご家庭は、母が来年から復職するそうで、上の子を幼稚園から保育園に切り替える(下の子も保育園に入れる)予定だそうだが、うちは環境が変わる手間を最小限にしたいので、小学校に入るまでずっと保育園の予定。

2017-12-15

2年後にどんな仕事をしているか

2年後にどんな仕事をしているかを含むブックマーク 2年後にどんな仕事をしているかのブックマークコメント

午前中はパターン認識と機械学習の授業の2回目。2年目なので何をどう喋ればいいかは分かってきているつもりだが、なぜか去年と比較して若干進度が遅い。去年の方がたくさん脱線していた気がするのだが、何が違うんだろうか。

昼休みの前半は学会の仕事で Skype ミーティング。時間が厳しかったのだが、特に問題なく開催できてよかった。

昼休みの後半は B3 への研究室公開。研究室公開は4回目だが、何を伝えればいいのかよく分かっていない。松本先生が毎年全体に向けてはやる気のない研究室紹介をやっていたのを思い出す(個別に来た人には全員と面談し、かなり話すのだが)。自分も最近は同様の結論に達しつつあり、宣伝した結果うちの研究室の特性を理解しない人に来てもらうようなのはもうやめて、うちの研究室の特長を理解して来てくれるほうがいいのでは(宣伝しなくて人が来ないならそれまでで、人が多くなくていい)、と思ったりしている。とりあえず「こういう人はこちらの研究室がいいのでは」と他研究室を勧めたりしているが、さすがに内部進学の人には自分の研究室のネガティブキャンペーンはしなくていいかな……。

午後は機械翻訳勉強会。研究室公開からの流れで見学するB3の学生がいたが、冗談ではなく英語でやっている(ので、英語がさっぱりの人はうちの研究室には来ない方がいい)のが分かったもらえただろうか。まあ、3つある勉強会のうち、英語でやっているのはこの勉強会だけだが……。(かつ、英語しか分からない人が聞いていないなら、説明は日本語になる)

夕方は企業訪問。[twitter:@sorami]くんとすだちの話をしたりしつつ、徳島の研究所の紹介をしてもらう。数年務めた前職を辞めて無職になってブラブラしていて松本先生のところに遊びに行ったら紹介された、という経緯で就職したと聞き、次の行き先が決まっているのに無職アピールするファッション無職(?)ではなく本当に無職を満喫していたようで、無職力の高さに圧倒される。好きに仕事をしたいなら実力をつけましょう、という話を地で行っていてすごい。

うちも研究室の紹介で就職が決まった学生がこれまで1人いるが(これまでは紹介してもマッチングしなかったケースが大半で、受けて企業にお祈りされたケースと学生が「ここは違う」と受けなかったケースと半々)、松本先生のところにはしょっちゅう企業の方々がリクルーティングに来ていたし、うちの研究室もそうやってふらりと卒業生が遊びに来て仕事を紹介できるような感じにしたいものである。ただ、新卒採用に関しては、採用の有無に関わらず毎年来てくださるような企業でないと、学生からするとあまり就職先として候補に挙がっていなかった気がする。オープンキャンパス等の高校生に向けたイベントでも、まさに受験する高校3年生は実は総数からすると1〜2割しかおらず、大半は高1〜高2だったので、採用活動に関しても、修士の新卒を獲得したいならB4のうちに研究室訪問で話をするほうがプラスに働くのではないかな、と思ったりする(そういえば、そのような形で縁のできた企業に就職した学生もいた)。

まあ、2年先に入社する学生の採用について考える、というのはよほど体力のある企業でないと難しいだろうし、大学側も2年後にうちにぜひ来てほしい、と思うような学生をコンスタントに輩出するような環境でないとわざわざ企業の方に来ていただけないだろうし(学生から外に出ていけばいいだけだけど)、研究室としても学科としても、長期的に首都大の底上げをしていきたい。

2017-12-14

准教授にしかできない仕事とは?

准教授にしかできない仕事とは?を含むブックマーク 准教授にしかできない仕事とは?のブックマークコメント

午前中は B3 の研究室インターンシップ。元のデータと処理後のデータを見てそれを生成するプログラムを作成する(生成用のプログラムはもう入手不能)という逆アセンブルみたいなことをしないといけないのだが、こういうプログラムを書くのも開発をしているとあることだと思うので、練習だと思ってやってもらう。

昼からはコース会議。来年の4月に組織再編を控えていて、何が(旧)コース会議の議題で何が(新)学科会議の議題なのか分からなくなったりする(汗)准教授の身分でこれなので、教授の方々はもうこんがらがっているのではなかろうか(逆に助教の人は情報が不足していて意味不明だろうけど)。

午後は代理で大学院教務委員会。最近ようやく学内の規則の変え方が分かってきたのだが、国会議員のような立場の人は毎日こんなことをやっているのかと思うと尊敬の念を禁じ得ない(国会議員が教員相当の仕事をして、官僚が職員相当の仕事をするという分担)。しかし任期数年でこのような業務をしても仕事にならないと思うし、議員の人たちには腰を据えて仕事をしてもらいたいと思う。(国公立大だけの話かもしれないが、大学職員がローテーションであちこち行くのも、ジェネラリスト養成にはいいのだろうが、昨今の情勢を考えると時代錯誤的で、まずスペシャリストを育てたあと、見込みのありそうな人をジェネラリストにした方がいいのではないか?)

夕方は南大沢に移動して基礎ゼミナールという学部生の授業の打ち合わせ。教養教育を重視する、という大学の方針がよく分かるのだが、話を聞いていると、思ったよりキャンパス間の分断が(少なくとも教員から見て)あるようで、荒川の学生はこんな感じ、日野の学生はこんな感じ、みたいなカラーがあるということで、そういうステレオタイプにはあまりはまりたくないのだが、これまでの経験上、前からいる教員の方々のおっしゃることは(信じたくなくて、色々あがいてみても)ほぼ真実だったので、自分も数年したら同じ結論に達しているかもしれない。

しかしやはり思うのは低学年の授業ほど高い職位の教員が担当すべきで、1年生の授業にこそ教授を当てた方がいいのでは?と思ったりする。(まあ、本学は教授と准教授は研究教育に関してはほとんど違いがないので、准教授がやるのはおかしくないのだけど)

2017-12-13

その昔 Theano で書いていた記憶

その昔 Theano で書いていた記憶を含むブックマーク その昔 Theano で書いていた記憶のブックマークコメント

午前中は共同研究のミーティング。今年度の前半はよかったが、後半は思ったような実験結果が得られなかったのが気がかり。しかし、ちゃんと企業内のデータに特化した内容のことをやるなら、本当に「共同」で(つまり先方にも自然言語処理にそこそこ詳しい人がいる状況で)やらないと難しいなと思ったりもする。

お昼は教職関係の書類の準備。来年度から高校の教科「情報」の教職の認定が通ったらしく、2年間に渡る書類の準備が報われたが、今度は平成31年度のカリキュラム改定に向けて書類を準備しなければならないのである。文科省の胸先三寸で振り回される、ということを思い知らされる毎日であるが、大学教員を続けるなら仕方ないと割り切るしかない。

午後は [twitter:@so1owingpixy] くんが遊びにきてくれる。彼は研究室の1期生で、新しい研究を模索していて深層学習の研究に飛び込むきっかけとなり(最初は Theano で書いていたが)、自分が首都大に来て初めて首都大の学生と自分だけで査読付きの国際会議に通すことができた思い出がある。深層学習計算機係としても研究室の運営に貢献してくれて、大変感謝している。

現在の話を色々聞いたりする。NAIST 松本研にいたときも、修士を出て自然言語処理(機械学習含む)関係の仕事が業務の一部に入っている人が1/3、所属する会社が自然言語処理(機械学習含む)関係の仕事をしている(が自分は従事していない)人が1/3、それ以外が1/3、みたいな感じで、修士を出ても自然言語処理の仕事ができるのは1/3もいればいい方で、もっと一般的なソフトウェアエンジニアリングに興味がある方が(卒業したあと)いいのだろうな、と思う。逆に、大学院から「将来自然言語処理に関する仕事をしたい」と思って専門を変えるなら、博士後期課程に進学するつもりで来た方がいいだろう。

夕方は研究会で、言語処理学会年次大会の発表希望の学生たちの目次を確認したりする。一応これで全員分聞いたが、10件ほどになりそう。ちなみに今年は国際会議に通りそうもないネタはボツにしてきている。これまでは(特に新入生は)教育的効果を考慮して、査読なしならいいか、という内容でも OK してきていたのだが、学部生のほとんどが大学院に進学するようになった(大学院から外部進学の学生は原則として博士後期課程に進学希望の学生しか取らなくなった)ので、それなら査読付き国際会議に通るような内容で発表し、そのまま投稿できた方が(大学院で研究内容を変えるにしても)教育的効果が高いので、やり方を切り替えたのである。

これで来年度の国際会議の歩留まりがどうなるかなのだが、メジャー国際会議(来年のNAACLは無理そうなので、ACL、COLING、EMNLP)に3本をコンスタントに通せるようになりたい。

2017-12-12

年末は CPU も不足気味

年末は CPU も不足気味を含むブックマーク 年末は CPU も不足気味のブックマークコメント

午前中は論文紹介に出る。

  • Adithya Renduchintala, Rebecca Knowles, Philipp Koehn, Jason Eisner. User Modeling in Language Learning with Macaronic Texts (ACL 2016).

これ、タスク設定が分かりにくいのだが、一部だけ母語で書かれているようなテキストで、文脈から単語の意味を推測しながら言語学習する、という状況の言語学習者のモデルを作る、という研究。来年 Duolingo が第二言語習得に関する共通タスクを行うらしく、こういう設定で自然言語処理を使って何ができるかは大変興味深い。

午後は進捗報告を聞く。最近色々研究的にバリエーションも出てきておもしろい。述語項構造解析タスクをやる学生が出てきたのは嬉しいことである。2年前も述語項構造解析に取り組もうとした学生がいたのだが、結局ベースライン的なものすら完成できず、研究テーマの変更を余儀なくされたので、ちょっと心配していたが、それなりに妥当感のあるベースラインができたようで、色々試せるようになってよかった。

GPU が最近慢性的に足りなかったが、どうやら最近は CPU も奪い合いのようで、嬉しい悲鳴である。来年度は(電源や空調的に厳しい)GPU ではなく、CPU(とメモリ)に投資したい。

2017-12-11

研究に使う時間は減ってない

研究に使う時間は減ってないを含むブックマーク 研究に使う時間は減ってないのブックマークコメント

午前中、論文紹介を聞く。新入生の論文読解スキルのトレーニングに課題があるのだが、論文100本読んでもらうのが大学院に入ってからなのに、学部生でも後期は論文紹介をしてもらっているので、順番を逆にした方がいいのかも、と思ったりする。ただ、紹介するつもりで読まないと読んでも読んだことにならないかもしれないし、オーバーヘッドは許容する、という考え方もあるだろう。とりあえず論文精読をもっと早く(入学してから数ヶ月後)にやってもらった方がよさそうで、速読より前にやった方がいいな、と思った。(あと、論文速読と違い、精読には教育的な意義があるので、ちゃんと自分も出席するようにしないと)

午後は進捗報告を聞く。いい進捗報告は、進捗報告以外の時間までに十分準備してきて進捗報告では論点を絞って議論できるというものだが、よくない進捗報告は、進捗報告の時点で必要な情報が揃っていなくて(議論ではなく)確認に時間を使うというもの。過去の資料も含めて全部共有してもらった方がいいのかな。サイボウズ Live が終了するのに合わせて、情報共有の方法も見直すつもりなので、いいやり方を導入したい。

あと、最近は進捗報告以外研究室のイベントになかなか時間が取れていないので、申し訳ない感じ。研究室関係で使える絶対的な時間は、娘が産まれて保育園に通うようになってから大きな変動はないので、結局学生数が増えたことによって(進捗報告の時間を確保するため、それ以外で)1人の学生に使う時間が減ってしまったことが主要な原因なのだが、自ら学び自ら考え自ら行動できる学生でないと、うちの研究室で受け入れるのは難しいのかもなぁ、と思ったりする。

2017-12-10

お見舞いに行きたいときに連れていく

お見舞いに行きたいときに連れていくを含むブックマーク お見舞いに行きたいときに連れていくのブックマークコメント

今週は昼からお見舞いに行く。昼だと人が多いかと思って電車とタクシーで来たのだが、完全に車で来た方がよかった案件。

お見舞いには兄夫婦も来ていて、こんなに家族が集まるのも珍しい、という光景なので、記念に写真を撮る。娘は完全に顔を隠していたが……。しかし先週は弟も見舞いに来ていたようで、みんな東京に住んでないのに結束力強いな。自分は奈良〜京都にいたら見舞いには来ないなぁ(そもそも知らされていないかもしれないが)、と思ったりする。

どうせ土日は娘の相手をしないといけないので、うだうだ家で過ごすくらいならお見舞いに来て少し疲れて(夜ぐっすり寝て)ほしい、というのもあるが、行きたいタイミングで行かないと「行きたい」「行きたくない」が交互にくるのでこちらの都合で行けないのが難しい。

帰ってきてから今日は遊びに行ってないので小金井公園に行く。もう日の落ちるのも早いのだが、暗くなっても小学生くらいの子たちはなかなか帰らない。とはいえ、人がどんどん減っていくので、何度もすべり台で滑ることができ、娘は満足だったようである。「一人ですべりたい!」と言って一人ですべったりしていたが、どんどん手も離れていくのだろうなと思ったりする(パパと遊びに行きたくない、と言われる日はいつだろうか)。

2017-12-09

吉祥寺駅で待ってる「はな子」さん

吉祥寺駅で待ってる「はな子」さんを含むブックマーク 吉祥寺駅で待ってる「はな子」さんのブックマークコメント

今日は朝からいい天気だったのでバスで吉祥寺へ。娘(3歳7ヶ月)は駅前の「はな子像」が気になるらしく、何度も見にいく。銅像になっていると「死んでいる」と判断するようで、「なんで象さん死んじゃったの?」と聞かれたりする。はな子は2016年に死んだようで、娘にも「(あなたが)生まれたときはまだ生きていたけど、おばあちゃんだったから、去年死んじゃったんだ」と説明したり。しかしなぜ歳をとると死ぬのか、というのを説明するのは難しい。

f:id:mamoruk:20171209120556j:image:w280

昼前に井の頭公園の池のスワンボートを漕いだりして、午後から動物園へ。かなり動物のことが分かるようになっていて、色々話したりする。そういえば、先月に保育園の遠足でここに来ていたので、若干どこに何がいるのか覚えていたりして、次は何を見ようよ、と教えてくれる。

モルモットが自由に触れるコーナーがあり、どうも先日の遠足で来たときは触っていたようなのだが、今回は全く近くにも寄らず。その代わり、売店ではモルモットの人形をものすごく欲しがり、帰ってきたら抱いて寝るほどだったのだが、現金というかなんというか……。

f:id:mamoruk:20171209150440j:image:w280

夕方は井の頭公園内の遊園地や遊具で遊んだり。知らない子と遊んだりするが、大人は人見知りするのに子どもは人見知りしないようで、おもしろい。

帰りもバスで家まで戻ったが、一日中外にいて疲れた……。

2017-12-08

研究は世界共通誰とでも

研究は世界共通誰とでもを含むブックマーク 研究は世界共通誰とでものブックマークコメント

金曜日の午前中は今日から毎週パターン認識と機械学習の授業(の機械学習部分)。1回目は実験に関する色々なことを話すことにしている。というのも、この授業で話さないと「訓練データ、開発データ、テストデータ」というような概念すら知らないまま修士を出てしまうことがあるようで、訓練データでテストして「精度99%!」というような残念な感じの記事を書いたりしないためにも(そもそもモデルが正しく学習できているかどうかを測るために、意図的に訓練データでテストすることはあるが)、ちゃんと紹介する必要があると思うのだ。

お昼から受験希望者の見学。実は今年度、冬季入試に関する(博士前期課程の)受験は物理的スペースの問題から全て(見学も)お断りしていたのだが、博士前期課程の定員がないなら研究生でもいい(ただし、研究生の場合は座席の保証はない)、という人に限り、見学もしてもらっているのである。博士前期課程の受験(研究生含む)の問い合わせは本当に今年は多く、3桁行くか?と思うくらいだったが、ちゃんとカウントしたら50人くらいだったので、倍に盛っていた。

とはいうものの、そもそも外部から受け入れられる人数は多くても毎年3人くらいなので、50人が受けたら10倍を超えるし(というか、そもそもうちの大学院の定員が情報科学は35人しかないし)、とても全員を(見学希望ですら)受け入れることはできないので、来年度から研究生希望者は研究計画書で選抜しようかなぁ、と思ったりする。すでに TOEIC スコア700点ない人は研究生を断っているが、英語試験のスコアだけだと今年は20人くらい研究生を受け入れないといけないので、社会人経験がない場合は博士後期課程の進学希望かどうかを聞いて、進学希望でない人の場合はお断りしている(これでも、来年4月からの研究生が2名、来年10月からの研究生が2名該当し、今のところそれらの人は受け入れ予定である)。

結局受験問い合わせのうち8-9割は中国人留学生で、修士号を取りたい(日本人の)学生を優先するか、博士号を取りたい(中国人の)学生を優先するか、というような問題になってくるのだが、アメリカが世界中から優秀な留学生を集めていることを考えると(アメリカ人はほとんどコンピュータサイエンスの博士課程には進学しないし)、日本でも(防衛大学校のような組織は別だろうが)特に国籍で判断する合理性はなく、日本語も英語も使える優秀な学生が来てくれるなら、自分は特に日本人を優遇するつもりはないのだが……。(修士号を取ったらすぐ就職したい留学生は、特に気兼ねなくお断りしているので、そこには自分も非対称性があるのだが)

2017-12-07

一度立ち上げたら最後触らない

一度立ち上げたら最後触らないを含むブックマーク 一度立ち上げたら最後触らないのブックマークコメント

午前中は研究室インターンシップ。言語処理学会年次大会に出すことになったが、プログラムも書く必要があるので、何を書けばいいか、ということを整理したりする。まあ、自然言語処理は前処理後処理だらけなので、これも研究のうちかなと……。

サーバ室に置いてあるワークステーションにログインできない(正確には、ログインしたらすぐ切断される)と言われたのだが、他の研究室の学生が勝手にうちのマシンのIPアドレスを使用していたらしい……。これ、そんなに被害はなかったからいいようなものの、ちょっとそれはいかがなものか感があった。ホスト名から逆引きしてみたら、おかしいのはすぐ分かりそうなものだが……。

お昼は臨時の学科会議。コース会議があったり学科会議があったりと目まぐるしい。最近学則や内規を見たり制定したりすることが増えてきて、これまで法学にはそんなに(全く?)興味がなかったのだが、これは法学をちゃんと勉強した方がよさそうに思ってきている。プログラムを書くのとそんなに大きく違わないが、書かれていないことをどのように扱うか、というところが結構違うように思っている(必ずしも議事録に残っていない、ルールが決まったときの経緯が重要だったりするし、これニュアンス汲んでよく運用できるなと)。

午後はメール処理とサーバ管理。どうも立ち上がらないサーバがあるのだが、なんとか立ち上がる手順を見つける。一つ古いカーネルにして systemd ではなく upstart で立ち上げると立ち上がる(この組み合わせ以外では起動しない)のだが、なぜこれだとうまく行くのか分からない……。しかしひとまず GPU を使えるようにしないとまずいので、ここから来年まで再起動しない前提で、立ち上げておく。なんともはや。

2017-12-06

論文を読むノウハウを叩き込む

論文を読むノウハウを叩き込むを含むブックマーク 論文を読むノウハウを叩き込むのブックマークコメント

午前中は EMNLP 2017 読み会(と ACL 2017 読み会)。今学期(というか冬学期)の前半は授業があるので全然参加できなかったが、今回は参加できた(来週は共同研究のミーティングで参加できないが)。読む論文も、これまでは short paper を(分量的な意味で?)選んで微妙な発表になる学生が多かったが、最近はみんな論文紹介に慣れてきたようで、分量は問わず(結果的に short paper を選んだとしても)読んでおもしろい論文を選んでくれるようになった気がする。「質より量」「量こそ質」と研究室でも時々言っているが、経験値の絶対量が少ない状態では何も議論できないので、とにかく最初は量だと思っている。

しかし論文を読む時間をせっかくこうやって共有していても、興味ない人は他人の論文紹介をほとんど聞いておらず、結果的に本人の論文読解能力もなかなか伸びなかったりして、難しい。ただ文字面を追って読むだけなら1人で読むのが一番速いし、わざわざ一緒に読むのはみんなで読まないと分からないこと(研究室で叩き込まれないと身に付かない、読み方のノウハウ)があるからなのだが、なぜそれが重要なのかは、一度就職してからでないと、なかなか分からないかもなぁ。自分自身、論文紹介の意味が分かるようになったのは、D1になってから(研究を初めて3年目)だったようにも思うし……。

午後は研究会で言語処理学会年次大会の目次発表の2日目。前回は4件の目次発表を聞いたが、今日はさらに6件。来週も3件くらいありそうで、投稿希望が10件を超えるのは必死。今年度は言語処理学会年次大会の少し〆切が早いし、人工知能学会全国大会に回ってほしい気もする。

昨年度、初投稿の人は書き方が分からない問題は、共著者に添削してもらうことで(教員の負荷を妥当な範囲に留めて)多数の投稿を可能にするモデルだったので、初投稿にも関わらず共著者がいない場合は見送ってもらわざるを得ない気がしてきている……。研究室3年目の人は元より、2年目の人も添削の戦力として期待して申し訳ないが、添削すると分かることも結構あるので(あと、自分自身研究室の先輩に添削してもらった人がほとんどになってきたし)、この体制で回せるようにしたい。

2017-12-05

博士号取ってそこからニューゲーム

博士号取ってそこからニューゲームを含むブックマーク 博士号取ってそこからニューゲームのブックマークコメント

本日は [twitter:@keiskS] くんに日野キャンパスに来てもらってトークをしてもらう。ちょうど自分が首都大に来るタイミングで彼が Johns Hopkins University に進学し、ブルガリア開催の ACL 2013 で彼の Microsoft Research Asia での研究の発表で合流したのが最後だったので、会うのは実に4年ぶりである。

ランチは1:1で食べたので色々プライベートなことも含めて話したが、ほとんど外に出られない現状からすると、こうやって会いに来てくれる人がいるというのはありがたいことである。奈良にいたときも、わざわざ奈良まで来てくれる人がありがたく思っていたものだが、日野キャンパスは十分都心から遠いので、日野キャンパスでもありがたい。

f:id:mamoruk:20171205144304j:image:w220

トークの内容は STAIR Lab セミナーで話すものと同じで、そちらで Youtube 配信があるらしいので特に説明することはないが、PhD で取り組んできた話がたくさん盛り込まれていて、90分たっぷり楽しめた。コツコツと研究するの、大事だな〜。日本とアメリカと別々に過ごしていたけれど、興味関心は同じところにあるということも分かり、懐かしさがある。

大学教員は自分より優れた後進を2人育てればいい(拡大再生産になる)、という話をどこかで聞いたことがあるが、助教時代から大学教員のキャリアがスタートしているとカウントすると、彼は自分より優れた後進第1号である(自分は2年間しか一緒にいなかったので、自分が育てた訳ではないし、2年間一緒にいた期間も、松本先生が指導教員だったが)。

今年度は初めて主査として博士号を取得する学生も輩出することができそうで、これから少しずつ自分の研究室からも博士後期課程の学生が世の中に出ていくと思うので、NAIST 松本研のようにうちの研究室のカラーというものが出ていくようにしていきたい。

keiskSkeiskS 2017/12/27 23:34 当日はありがとうございました。トーク前の紹介の際にNAIST時代の話をしてくださり、とても懐かしく、感慨深かったです。松本先生も小町さんも自分にとっては自然言語処理研究(&人としての在り方)の親鳥のような存在なので、研究に関するイロハの根幹はNAIST時代(特に言語教育勉強会&MSRAでの共同研究)に培われたと思っています。

自分がJHUに行くことをお伝えした際に「いつか恩返しします」と言ったところ、「自分を追い越してください、それが恩返しです。」と激励していただいたのを今でも覚えています。研究の視野にしてもキャリア的(&人間力)にも、まだまだ到底及んでいるとは思えませんが、研究やプライベート等々、またゆっくりとお話できる機会を楽しみにしています。

研究室の皆様にもよろしくお伝え下さい。(この日記を見ている人が多数だと思いますが。。。)

mamorukmamoruk 2018/01/25 20:11 id:keiskS くん
お返事遅くなってすみません!日野までお越しいただいてありがとうございました。研究室メンバーにも、よい刺激になったのではないかと思います。松本研も一朝一夕にできたものではないでしょうが、うちも少しずつ(近いうち)世界に羽ばたく人が出てくるようになるにではないかな、と思っています。

気長である、というのは研究でも教育でも大事だな、と思っていて、今の生活、とてもエンジョイしています。

またいずれどこかでお会いしましょう!!!

2017-12-04

修論の進捗具合どうですか?

修論の進捗具合どうですか?を含むブックマーク 修論の進捗具合どうですか?のブックマークコメント

午前中、久しぶりに論文紹介に出る。

  • Sakaguchi et al. Grammatical Error Correction with Neural Reinforcement Learning. IJCNLP 2017.

これ、深層強化学習を用いて文法誤り訂正をする研究で、GLEU という文に対する評価尺度で誤り訂正を最適化するために強化学習を用いていて、アプローチも分かりやすいし、通ってよかった。(IJCNLP 2017 では自分が NLP Applications の area chair を務めていたので、最初はこちらに来たのだが、明らかに自分と conflict of interest があるので、担当から外してもらっていた)

午後は博士後期課程の受験希望者に、研究室内で修士論文に関するトークをしてもらう。博士後期課程の受験希望者は、社会人博士でもなければ現在進行形で修士論文を書いていると思うので、研究室でトークをしてもらっているのである(博士の入試では、博士後期課程の研究計画を中心に聞くので、突っ込んで修士論文の話を聞く時間がない)。

結局4月からの博士後期課程の受験生は3人(研究生が2人)になりそうだが、冬季入試は博士後期課程の受験生がそんなにいることを想定したスケジュールになっていない(夏季入試は2日間あるけど、冬季入試は1日しかない)ので、これちゃんと回るのか少し心配である。まあ、博士前期課程の面接と博士後期課程の面接をパラレルでやればいいだけだが……。

2017-12-03

ゲレンデを滑って降りて「もう一度」

ゲレンデを滑って降りて「もう一度」を含むブックマーク ゲレンデを滑って降りて「もう一度」のブックマークコメント

午前中、諸事情で昨日にできなかった仕事をさせてもらう。母に娘を見てもらうつもりだったが、急に無理になったので、妻に娘を見てもらえる日曜日に時間を確保させてもらったのである。

今回の仕事自体は無事終了したが、固まった時間がないとできない仕事がまたできなくなってしまった。病児保育などもこれまで実家に頼りっぱなしだったが、他の手段もちゃんと確保しておかないといけないな、と改めて思ったりする。やっぱりフローレンスかな……。

午後は珍しく小金井公園のゲレンデでソリに乗りたいと言うので、ソリを持ってゲレンデに行く。何回か(十何回か)一緒に滑ったが、これまでは途中で疲れて「抱っこして」と言い出すことが多かったのに対し、今回は一度も「抱っこして」とは言わず、成長を感じる(「抱っこして」って言うならもう滑るのは最後だよ、と言ったせいかもしれないが)。

夕方は花小金井の昭和記念病院までお見舞いに行く。車で来たのは初めてだったが、この距離だと明るい時間帯なら自転車でも近いので、自転車で来てもよかったかな。次回は別の経路を試してみよう。

2017-12-02

銭湯に行けば何でも売っていた

銭湯に行けば何でも売っていたを含むブックマーク 銭湯に行けば何でも売っていたのブックマークコメント

後期は妻が土曜日の午後に授業があり、しばらく(数ヶ月単位?)母にも娘をお願いできない見通しなので、毎週ワンオペ育児である。

午前中は小金井公園に行く。娘(3歳半)はかき氷を食べたかったようだが、さすがに売店でも売らなくなってしまったようで、娘は失意のまますべり台で遊ぶ。お昼は江戸東京たてもの園の中のレストランで武蔵野うどんを食べたかったのだが、娘に拒否されたので、自分は失意のまま帰るが、「温泉に行きたい!」と言うのでいつもと違うスーパー銭湯に行くと、そこのレストランに武蔵野うどんとかき氷があり、全てが満たされた感があった。スーパー銭湯、テルマエ・ロマエかと思うようなスペースである。

3時に帰宅すると車の中で娘が寝てくれたので、少しだけ仕事をする。土日は全然昼寝をしてくれなくなったので、こうやって昼寝してくれるだけでありがたい。ときどき夕方から昼寝するのは(そのまま朝まで寝てくれるならいいが、大抵夜に目が覚めて深夜まで起きるので)勘弁してほしい……。

土曜日に仕事ができなくなった影響で、(今年度から保育園は送りだけになったので)平日に18時過ぎまで仕事をしたりして(進捗報告も最近17時は終わらないし)、週40時間の勤務時間を確保しているが、夕方に仕事をして帰ると朝に起きる時間が6時から7時になり、早朝に仕事をしていた時間が夕方に振り替えられるだけで、あまり有意義に時間を使えていない気がする。やっぱり17時に帰宅して、朝5-6時に起きて仕事しようかな。

2017-12-01

論文に書かれていないことを知る

論文に書かれていないことを知るを含むブックマーク 論文に書かれていないことを知るのブックマークコメント

午前中は Wasserstein GAN に関する論文紹介を聞く。GAN の学習が安定しない問題を回避するアイデアは理解できたが、実装レベルで全然分からない(数式とアルゴリズムが対応していない)。これ、ちゃんと学習するためにはもっと色々やっている気がするし、逆に言うと論文にはやっていることが中途半端に書かれているような?

あとで WGAN を Chainer で実装したというエントリを読んで、自分が論文を読んで疑問に思ったことが全部書かれていて、お見事、と思った。原論文の著者らによる PyTorch のコードの話も見て、こういう学習に関する「必殺パラメータ」みたいなのがある手法は厳しい、という気持ちしかないが、それを言うと深層学習全般が厳しい気もするので、(少なくとも生成の絡むタスクでは)仕方ないのかもしれない。

午後はメール処理、事務処理等々。研究室の約半分の学生が国際会議でいないので、こうやって溜まった仕事を減らすことができるが、逆に言うと研究室の学生数が10数人でないと、学生の論文紹介を聞いたり余裕を持って仕事をしたりすることができない、ということだろうか。