MATSUZAKIの日記 RSSフィード Twitter

Back to Peppermint.jp

2017-12-11

AI 竜星戦 2017

Raynzで出場して、予選11位突破(参加者全員突破だけど)、本線6位でした。

またPolicy network + value network + owner networkの重み共有による教師あり学習について、独創賞をもらいました。

目的関数としてOwnerとValueの二乗誤差を足し合わせることでValueの寄与を1/361にすることで棋譜生成無しでもVNの学習出来ています。

# この部分についての詳細は「Rayn の技術と自戦記 UEC 杯3 位への歩み」にあります。

しかし、上位8位付近までのソフトでは棋譜生成と強化学習に成功している状況ではVNとPNの精度でじわじわ押されていた感がありました。

Raynzの構成としては、Rn.4.20部分の思考エンジンと、Tripleizeさんによる1中央サーバー+10ワーカーでのリーフ並列になってます。

春のUEC版Raynから竜星戦版Raynzで、Rn部分で+145、分散処理部分で+200程度は強くなっているのに対して、他ソフトの話を聞くと+600だったり

前バージョンに4子だったり、勝率100%だったりと景気のいい強化っぷりにはついていけてなかったようです。

OSS公開してることでいくつかのソフトの対局相手・調査対象として使われているようで、コンピューター囲碁界隈の底上げには繋がってよかったのかな…

2017-11-09

人工知能学会誌

人工知能学会誌 Vol. 32 No. 5にRayn の技術と自戦記 UEC 杯3 位への歩みで小林さんとRaynについて書きました。

https://www.amazon.co.jp/dp/B076466H47

2017-03-19

第10回UEC杯コンピュータ囲碁大会

Rayの作者の小林さんとチームでRay+Rn=Raynで出場して3位でした。

CGOSや内容から見るに4位〜8位引き離したというよりはコイントスして運よく勝てたに近い状況とはいえ暫定世界4位を名乗れる。

http://www.computer-go.jp/uec/public_html/result2.shtml

実行していた版のソースはraynブランチにpush済みなので興味があればどうぞ。

いつものcgosのRn.x.yy-4cはi7-2600K+GTX980Tiかたまにi7-6700K+TITAN Xで動かしているのを、せっかくなので56CPU+Tesla P100×1のGPU BOOSTタイプ Tesla P100で参加した。56スレッドで探索するとPolicyNetwork/ValueNetworkの評価キューが詰まって28スレッドで動かしていたけどそれでも結構CPUが遊んでいたのが若干残念。

このサービスはGPUの単体性能が高くてEC2でマルチGPU使うのと比べて何も考えなくても性能出しやすい反面、仮想化薄いらしくハードウェア障害でも別ホストに自動で移ったりしないのが面倒。


追記:

とりあえずCGOSでCGIに3連敗してる。

2016-12-07

2016-01-29

AlphaGo

各所で話題になってるGoogle の DeepMind 囲碁論文が面白い。

https://storage.googleapis.com/deepmind-data/assets/papers/deepmind-mastering-go.pdf

RAVEやProgressive wideningのようなUCT系の探索ノード決定ヒューリスティックを使わず、ニューラルネットが吐いた確率分布を使ってたりはするけど、rollout policyやtree policyはもろいままでの囲碁AIどおりだし、ニューラルネットへの入力にダメの数やシチョウ入れてるので、一部ニュースの汎用AI作ったら囲碁も強かったんだいって言うのは無理がある気が・・・

Connection: close