Hatena::ブログ(Diary)

やねうらお−ノーゲーム・ノーライフ このページをアンテナに追加 RSSフィード

GT-Rの買取ならここですわ。どこよりも高く買取ってもらえるはず。お勧め!GT-R 買取
電王戦出場記念! 書籍化されたで! 監修したで!(`ω´) 絶版なってしもた Kindle版で復活!! 記事書いたで!
解析魔法少女美咲ちゃん マジカル・オープン!

YaneuLabs / やねうら王公式 / やねうらおにメール / twitter / プロフィール

 | 

2014-11-05 電王トーナメントその後

[] 電王トーナメントその後  電王トーナメントその後を含むブックマーク  電王トーナメントその後のブックマークコメント


昨日までの記事で、書き忘れていたことがあるので、いくつか補足しておきたいと思います


SeleneはBonafishか?


Bonafishというのは、評価関数Bonanzaのfv.bin相当で、探索部をStockfishに差し替えものを言います


西海枝さんに聞いてみたところ、「Bonafishも、実は作ったんですけどねー(あんまり強くなくて、いまはBonafishではない)」とのことです。


私もBonafish作りましたが、PonaX相手に3割勝てなかったので、西海枝さんのほうは評価値の差分計算方法がまずく、npsが私のBonafishより2割ぐらい遅いようなので、おそらく25%ぐらいしか勝てないでしょう。


SeleneがPonaXに4割勝つ」ということの意味するところは、つまり、そこからの改良(主にNDFの相対KPPでの学習をしたことによる棋力向上)でしょう。


mate 63 ≠ 63手詰の件


まず、AWAKEの「mate 63」の件ですが、「mate X」については以前から何度か書いているので、今回は詳しく定義を書かなかったのですが、間違って理解している人が多いので補足します。


mate 63は63手詰めではないです。63手詰めというと、連続王手で63手で詰み、それが詰ませるときの最短手数であるという意味ですが、そうではないです。また、mate 63は王手 or 詰めろの連続でもないです。


「相手がどのように応じても最長でも63手で詰ませることが出来る」ということです。無駄合いが含まれますし、迂回手順での攻め方も含まれます


詰将棋を考えてみるとわかると思いますが、相手側の応手はすべて読まないといけませんが、こちらの応手はその手で詰むのであれば他の指し手を読む必要はありません。(最短手数を目指さないでいいならば)


実際にはAWAKE側が最善を尽くせば20手ぐらいで寄るのでしょうがたまたま読めたのが63手かかる手順だった、ということです。やねうら王のほうもAWAKEの「mate 63」を認識した局面から数手進んだところで「mate 43」を認識しました。


それでも「mate 63」はやっぱり凄いなー(部分的であれ、そんなに深く読んでいるのかー)というのが私の感想です。


AWAKEのseldepth = 50の件


部分的にでも50手も読んでるということは、1手ごとに2通りの指し手を考慮するとして、2^50 = 1,125,899,906,842,624局面も読んでいるのかー。と思っている人がいるようなので、これに関しても補足します。


seldepthというのは将棋所で動かしたときに、探索深さのところに「15/30」のように表示される右の数字(「15/30」の「30」のほう)です。


これは何の数字かと言うと、PV node(最善応手列に関わるnode)での読みの深さです。PVは最善応手列ですので1本道です。


PVを作るためには、当然、それ以外の指し手もそれなりに読まないといけないのですが、そのへんはざっくりとしか読んでいないのがいまのコンピューター将棋でして、seldepth = 50を読むための必要なnode数は、2^50というよりは2^25より少し大きいぐらいと考えたほうがいいでしょう。


探索部の作りにより、seldepthが伸びやすいソフトと、seldepthが伸びにくいソフトがありますが、seldepthを伸びやすくしておいたほうが超部分的にですが深く読めて、深く読まないと形勢が判断できないような局面においてはそれが正しい形勢を反映していることが統計的に多いので、seldepthを伸びやすくするほうが有効なのではないか、と私は思ったのですが、真偽のほどは実験してないのでわかりません。


■ やねうら王は電王トーナメント期間中に強くなっていた?!


初日バージョンでPonaXに少し勝ち越す程度。3日目のバージョン初日バージョンに5%程度勝ち越すようになっていたようです。参考まで。


■ やねうら王はこのあとさらに強くなる?


平岡「やねさんなら、このあと1ヶ月あればAWAKEのKPAとかやれるんじゃないですか?」

やね「私なら1週間あれば余裕ですね。1日で実装して6日で学習を回す、みたいな…」

平岡「ひえー。そんなことより、秒読み(のバグ)直しましょうよ!」

やね「は、、はいすみません。」


そんなわけで強くするのはさておき、秒読みのバグなおしてきます…。

あと、置換表上限も修正しておきます…。


■ やねうら王は定跡を入れる


習甦の方法で定跡を1万通りぐらい入れておきます。なかには損な定跡も多分にあるでしょうけど、多少不利な定跡でも中終盤で盛り返せるかも知れませんし、プロ棋士先生には勝負にこだわらず、いろんな戦型の将棋を楽しんでもらえればと思います


■ やねうら未来定跡はどうだったのか


やねうら未来定跡は、予選1回戦でPonanza相手にやって一方的作戦負けになったため、そのあと定跡オフにしていましたが、思うところあって、最終局(3位決定戦)だけやねうら未来定跡をオンにしました。


オンにした理由は、3位決定戦だったので負けても4位であり、電王戦出場には響かないということと、Seleneに搭載されている定跡を本大会での棋譜から調べたところ、やねうら王側がそれで暴発してしまうような変化にはならないと判断したからです。


やねうら未来定跡は、事前にやねうら王が自ら長い考慮時間を費やして考えだした定跡です。

本局は矢倉模様になりました。序盤のわずかな形の良さを活かしてSelene相手に作戦勝ちになりました。


コンピューター自らが矢倉戦法(とその早囲い)を再発見し、そして、自らの思考により、端歩を突き越しあってそれで作戦勝ちというのを意識し、端攻めから快勝しました。一昔前のソフトは端歩のタイミングがおかしいことが多々あったのですが、今回のやねうら王は端歩を突くことの必然性(相手玉のほうが端に近いので端歩を突き合うのは自分が有利!)を理解した上での端歩突きだったわけで、序盤はともかく、中盤に関してはコンピューターが長時間考えれば、中盤の定跡を自ら開拓できるだけの力をつけてきたということは言えそうです。


■ やねうら王の不安定性について


同じぐらいの棋力のソフトと互角の勝率からと言って、下位のソフトに同じぐらい勝つとは限らないのが将棋ソフトで、そういう取りこぼしが少ないように探索部を調整するのが普通なのですが、やねうら王はそういうチューンは一切してないです。AWAKEなんかは比較的取りこぼしを少なくするように調整しているそうです。


探索部の調整は結構難しいのですが、やねうら王も、調整していきたいですね…。


AWAKEPonanzaとApery、やねうら王の差


AWAKEPonanzaは探索部をかなり調整しています


巨瀬「探索部、半年ぐらいかけて(Stockfishの探索部から将棋向きに)調整してR50〜100ぐらい」

半年かけてR50〜100上がる」を肯定的に捉えるべきか、否定的に捉えるべきかは私にはわかりません。


AWAKEPonanzaもそのへん力を入れているので当然長い時間を費やして調整しています

やねうら王やAperyは、評価関数の改良に期待をかけています評価関数のほうが伸びが顕著なので(ちょっとした改良でR200や300ぐらい伸びかねない)、まずはこちらを改良するほうが(少ない時間で)強くできそうだからです。


やねうら王も探索部を調整したいのですが、半年も費やすのはちょっと…。


■ AperyがSelene相手に金のタダ捨てをして連続王手千日手誘導して勝った件


相手による連続王手千日手を勝ちだと判定しています。どのソフトでもそうなっていますSeleneはそこ、きちんと実装していなかったようですが…。


それで、相手から連続王手千日手が勝ちなので、その局面誘導したほうが短手数で勝てるなら当然その局面誘導します。それが金のタダ捨てだったというだけです。


連続王手千日手Seleneがきちんと実装していない&金のタダ捨てで最短手順でその局面誘導できたという二つの偶然によって発生した現象です。やねうら王でもこの局面なら金をタダ捨てする手を候補に挙げます


ただ、こういう大会の場でこれが起きたのはドラマであり、また「金のタダ捨てで勝ち」という手順の妙もあって、この局面図はコンピューター将棋史に確実に残るでしょう。


https://twitter.com/shogi_pineapple/status/529485798182100992/photo/1

f:id:yaneurao:20141105084959p:image


■ 今回のマシンは本当に速いのか?


先日発売になったばかりの8コアCPUCore i7-5960XなのでPC提供しているドスパラさんはよく頑張ったなという印象なのですが、このPC、8コアの割に定格が3GHzしかないので、遅いです。やねうら王のベンチマークで1スレッド当たりの探索速度は800knpsしか出なかったです。(Core i7 4771で1Mnps超え) 2割ぐらい遅い計算ですね。コンピューター将棋の通常探索のときの性能で考えるなら6コア 3.5GHzとあまり変わらないように思います


準決勝AWAKE vs やねうら王を見守る山本君に聞いてみた


大会最終日、準決勝AWAKE vs やねうら王を見守る山本君。


やね「山本君は、やねうら王のほう応援してくれてるんでしょ?」

山本「なんでっすか?」

やね「だって、やねうら王のほうがAWAKEより弱いとしたら、やねうら王が勝ったほうが、Ponanza的には優勝しやすいでしょ?」

山本「そんなことは考えてないです。強いほうが勝ち上がってきてもらえれば。」

やね「(おお、これが、王者の風格か…)」


その後、AWAKEがやねうら王に勝ち、決勝でPonanzaAWAKEに負けはしたものの、山本君の姿勢には敬意を表します!

茶田茶田 2014/11/05 13:32 未来定跡は作り直さないのでしょうか。今の強さで自己対戦で定跡を作ったら面白いかなと思うのですが。

飛車1枚?飛車1枚? 2014/11/05 15:23 来年のやねうら王を飛車1枚強くする自信はありますか?
さすがに非現実的に感じるのですが

yaneuraoyaneurao 2014/11/05 16:29 ↑*1 まだ、R500ぐらいは余裕で上がると私は思ってますけどね。来年にそれが間に合うかどうかはわかりません…。
↑*2 未来定跡はいずれ作り直します。まだまだやねうら王を強く出来る可能性があるのでまずは強くしてからです。そうしないと作った定跡が無駄になってしまいますので…。

R_XeonR_Xeon 2014/11/05 19:27 電王トーナメントお疲れ様でした.

定跡を1万通りと言うのはある手数(例えば32手)での局面数のことですよね?(1万の進行があると言う意味です)
完全ななぞりを食らわなければ,やねうら王は基本的に勝てると思ってますので,ある程度の乱数+定跡+局後学習で万全といったところですか.
また改良に関してですが,昼休憩(夕休も)前の戦略で少し批判があったようなので,例えば11時50分時点で手番であれば10分持ち時間を減らして,1時間考慮し続けるみたいなことを実装して頂ければと思います.

やねうら王やねうら王 2014/11/06 03:16 やねうら未来定跡も含めて大会3日目での完成度は大体どれぐらいなんでしょう?
また棋士側に貸し出す時までにどれぐらいの完成度になるんでしょうか?
ブログの解説の感じだと8割ぐらいなのかなぁと勝手に思っています。

yaneuraoyaneurao 2014/11/06 07:50 ↑*2 今回は局後学習なしで行こうと思います。定跡が多数あれば、序盤は散る(バラける)でしょうから、局後学習なしでいいかなと。考慮時間の調整は下手なことするとバグの原因になりかねないのでいじらないつもりです。
↑*1 やねうら未来定跡は面白い定跡も多数あるのですが、作ったときのやねうら王が弱かったこともあっていろいろおかしい定跡もありました。プロ棋士に貸し出すときには、やねうら未来定跡はやめて普通の定跡にしますし、学習も収束していると思うので大会3日目よりはR50ぐらいまだ上がるのではないかと思います。

YakitoriYakitori 2014/11/07 02:19 トーナメントお疲れ様でした。
個人的にこのブログを見ていてラッキーだったのは、やねさんのライブが見えたこともありますが、他の開発者の声が混じっていたことです。
こういうのって自分の生活圏にはないので貴重です。
ありがとうございました。

玉ねぎ坊や玉ねぎ坊や 2014/11/07 16:32 大会お疲れ様でした。やねさんのPR文書の中の未来定跡にはかなり驚かされました。と同時にワクワクしました。今度の電王戦では実装しないということで少々残念ですが、それは未来の(あるとすればですが)電王戦にとっておくのだろうと考えて今回は諦めます(笑)。
ただ次回のFinal電王戦ではやねうら王らしさというのを前回の電王戦のように存分に見せてかつ魅せてもらえればと切に思っています。今から楽しみですわ。

茶田茶田 2014/11/10 16:41 「強い人ほどハンディを活かせるという仮説は、はっきりと数値にも出た。飛車落ちは初級レベルだと172点差、有段クラスだと289点差」と棚瀬さんは言っています。
https://twitter.com/tanaseY/status/512811154486222850
今の強いソフト(24でr3300超)に飛車を落として勝つという棋譜は想像できないですが、r3800とかのソフトが見せてくれるんですかね。楽しみです。

トラックバック - http://d.hatena.ne.jp/yaneurao/20141105
 | 

1900 | 01 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2013 | 01 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2014 | 01 | 02 | 03 | 04 | 06 | 08 | 10 | 11 | 12 |
2015 | 01 | 02 |


Microsoft MVP
Microsoft MVP Visual C# 2006.07-2011.06