カレーなる辛口Javaな転職日記 RSSフィード

2017年 06/13

スーパーマリオで分からなくするAlphaGo超解説

えーと,あれ?

これって全部間違いだよね?


私は囲碁の知識はほぼゼロですが、その昔、プロのゲーム制作者を目指していたこともあり、

目指していたけど,明日から本気出す?

なぜ、これまで囲碁はコンピュータよりも人間の方が有利だったのでしょうか? 最も大きな要因は、「探索空間の大きさ」です。

うーん,それもあるけど,評価関数の作りにくさというのも大きい.*1

評価関数の精度が高ければ,効率良く枝刈りして探索空間を実質的に小さくできる.これができないと,チェッカーや将棋でも探索空間が大きすぎて,プログラムは強くなれなかっただろう.

単純計算…コンピューターの方が得意

思考…人間の方が得意

まずは「思考」の定義をしような.

今回、AlphaGoを勝利に導いたのが、「モンテカルロ木探索」の発明だと言われています。

は?

モンテカルロ囲碁はAlphaGo以前の世代から使われてるでしょ.*2

http://minerva.cs.uec.ac.jp/~ito/entcog/contents/lecture/date/5-yoshizoe.pdf

これの発売が2012年.amazonで調べるだけでも裏付けは取れる.

AlphaGoで画期的に変わったのがディープラーニングの適用.

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装 深層学習 Deep Learning (監修:人工知能学会)

ここで深層学習というキーワードが一言も出てこないのには恐れ入った。深層学習はAlphaGoで一躍有名になり,すでにバズワードの一つとなっているというのに.

  • これら20体のマリオを実際にプレイさせて、より距離が進んだマリオが優秀なマリオだという評価を下します。
  • 20体のマリオから優秀なマリオ2体を親として選びます。この2体の親マリオが持つ遺伝子データを交叉させて、子マリオを2体、生成します。

これは遺伝的アルゴリズムの解説だと思う.

遺伝的アルゴリズム―その理論と先端的手法 金融工学のための遺伝的アルゴリズム Robust Control Systems with Genetic Algorithms (Control Series) 


東条雅彦?

まさか同姓同名の別人ってことじゃないよね?単純に畑違いの人なんじゃ.




関係ないけど,ぐぐってて見つけたのでついでにメモ.

翔泳社だし,AlphaGo関連本の中で一番期待できるかな?

追記:どうも内容が軽すぎるらしい.こりゃ技術者向けじゃねーな.

*1:他のゲームプログラムでも最後まで読み切ってるわけではなく,適当な所で打ち切って,その時の評価関数の期待値が最も良くなるものを選ぶ.もし評価関数が完璧ならば,1手先を読むだけでも必勝のプログラムになるが,もちろんそんな美味い話はなかった.

*2:つまりは「一世代」前のアルゴリズム.AlphaGoでも使われてはいるけれど,決め手はそこじゃない.

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト

コメントを書くには、なぞなぞ認証に回答する必要があります。

トラックバック - http://d.hatena.ne.jp/JavaBlack/20170613/p1