Hatena::ブログ(Diary)

shi3zの長文日記 RSSフィード Twitter

2016-03-14

[]早くもAlphaGoクローン現る!これが21世紀か! 06:07

 いやー昨日の対局も興奮しましたね。

 イ・セドル九段が意地を見せてついに一勝しました。思ったよりキャッチアップが早かったですね。さすが魔王と呼ばれるだけの棋士です。


 AlphaGoの乱れ方も往年のSF映画の悪いコンピュータみたいでよかったですね。


 「コ・・・コレハ・・・プログラムニ・・・ナイ・・・制御不能制御不能」


 みたいな感じでしょうか。


 これまで一見すると悪手に見える手が、後半から活きてくることから、実はAlphaGoは第一手目から最後まで読みきってるのではないか、なんていう噂もありましたが、まあ現実的にそこまでは難しいのであれですね。


 しかしAlphaGo、CPUが1200でGPUが260ってのはどういうことなんでしょうか。足りなく無いですか。GPU。特に畳込みニューラルネットワークをやるんだったらCPUの数よりもGPUの数の方が重要です。単純にGPUの数だけなら紅莉栖の方がTITANXを4枚✕100=400というぶんだけ多いことになってしまいますが。


 さあそんなわけでAlphaGoってどんな感じなの!?


 ということを実際に試す猛者が現れました。すごいね21世紀。このスピードでキャッチアップされるんだから。

A replication of DeepMind's 2016 Nature publication, "Mastering the game of Go with deep neural networks and tree search," details of which can be found on their website.

GitHub - Rochester-NRT/RocAlphaGo: An independent, student-led replication of DeepMind's 2016 Nature publication, "Mastering the game of Go with deep neural networks and tree search" (Nature 529, 484-489, 28 Jan 2016), details of which can b

https://github.com/Rochester-NRT/AlphaGo

 とはいえまだ開発中。

 最終コミットがこのブログを書く1時間前というかなーりhotなリポジトリになってます。


 単純なニューラルネットをローカルのマシンで動かすならChainerの方が書きやすくていいんだけど、大規模なニューラルネットを複数ノードに分散するなら今のところTensotFlowの方が良さそうだなあというのが最近の感想です。

This is not yet a full implementation of AlphaGo. Development is being carried out on the develop branch.

We are still early in development. There are quite a few pieces to AlphaGo that can be written in parallel. We are currently focusing our efforts on the supervised and "self-play" parts of the training pipeline because the training itself may take a very long time..

|Updates were applied asynchronously on 50 GPUs... Training took around 3 weeks for 340 million |training steps

|-Silver et al. (page 8)


 今のところ、自分で自分と戦って学習するところを主に実装中とのことですが、実際に試すには50GPUで34億回学習させないとならないらしい。3億4千万回*1って・・・・


 これを実際に試せる環境が地球上に何箇所あるのか知りませんが、とにかくGPU争奪戦が始まっているようです。石油戦争の如く。


 日立は早くも経営判断を行う人工知能を開発中だとか。

コンピューターが人間の脳のように考える人工知能(AI)技術の進化によって、企業の最高経営責任者(CEO)が不要になる時代は、そう遠くないかもしれない。日立製作所は、議題を入力すると約1分で経営判断の材料になる回答を提供する技術を開発している。外部の企業に販売するほか、日立本社やグループ会社で今回の技術を活用する計画だ。


IBMワトソン追い越せ 日立、AIで経営判断  :日本経済新聞

http://www.nikkei.com/article/DGXMZO91258780S5A900C1000000/


 もう人間が判断しなくていいとかラクすぎる!!


 そういえばダーティペアでは、人事は全てコンピュータが決めていた。


ダーティペアの大冒険

ダーティペアの大冒険


舞台は22世紀[注 1]の銀河系宇宙。

銀河連合が「クラレッタ三重星事件」[注 2]を教訓に設置したあらゆるトラブルに対処する専門機関、WWWA(スリー・ダブリュー・エー、World Welfare Works Association―世界福祉事業協会)に所属する犯罪トラブルコンサルタント(略して「トラコン」、以下同じ)“ラブリーエンゼル”、別名“ダーティペア”こと、ケイとユリが活躍するスペースオペラである。

トラコンは彼女達以外にもおり、また犯罪調査以外に経済問題、医療問題など各種専門分野のトラコンもいる。地元当局の捜査調査結果に納得出来ない利害関係者がWWWAにコンサルティング要請を行なって、その申し立てが妥当と見做された場合に派遣される。要請を受けた場合に誰を派遣するかはWWWAの中央コンピュータによって決定される。

https://ja.wikipedia.org/wiki/ダーティペア


 ね?



 わりと昔の日本のSFでは人事をコンピュータが決めるのは普通の設定で、「なぜオマエが配属されたんだ」みたいな感じでコンピュータの判断に人間側が苦しむという場面が多かった気がするが、最終的にはやっぱりコンピュータの判断は正しかった、みたいになるのが通例。


 まあ経営や人事にどんどんAIは入り込んでいくだろうね実際。



 この時代の趨勢を受け、入門書も出揃ってきました。


はじめての人工知能 Excelで体験しながら学ぶAI

はじめての人工知能 Excelで体験しながら学ぶAI

イラストで学ぶ ディープラーニング (KS情報科学専門書)

イラストで学ぶ ディープラーニング (KS情報科学専門書)


 難易度でいうと、下から順番に難しくなっていく感じでしょうか。


 これまで深層学習というと、ものすごく浅い全般的な説明と、ものすごく深い数式的な説明の本に二極化していたのが、ようやく普通のプログラマーにも分かりやすい形の本が出始めてきたなーという感じです。


 でも残念ながらまだ決定版という感じのものはないですね。


 そんなこんなで今週末はChaienr Meetup。

 今回も超人気でダメ元でいいからLTすれば入れるのに勿体無い、という感じですが。


 しかしChainer、サンプルが少ないからなあ。もうちょっとがんばらないとTensorFlowに軒並み持って行かれそう。


 国産フレームワークとして頑張っていただきたい。


 さ、そんなわけで世紀の対局も明日の一局を残すのみとなりました。

 一応負け越しは確定なんだけど、それでも頑張るイ・セドル九段。

 我々機械側の応援団も、イ・セドル九段にはぜひとも頑張っていただきたい。


 というわけで今夜のニコ生「電脳空間カウボーイズZZ」では、DEEPstationの開発者で、かつ囲碁大好き秀島さんをゲストに迎え、これまでの対局を棋譜から振り返りつつ、AlphaGoの向こう側に垣間見える世界を語り合うことにしたいと思います。

https://i.gyazo.com/7e56531617c5048ac12bfa8bfe914aa2.png

no title

http://live.nicovideo.jp/watch/lv255488813

*1:最初34億回って空目してた