Hatena::ブログ(Diary)

ひよこ将棋、はじめました。


  ひよこ将棋関連の実行ファイルは → ここ

2011-10-05

モンテひよこは弱すぎました…

11:58 | モンテひよこは弱すぎました…を含むブックマーク モンテひよこは弱すぎました…のブックマークコメント

モンテひよこ version 0.01 が出来ました。
不完全ながらUSIプロトコルにも対応しましたので将棋所で遊べます。


しかし…


・探索開始局面ですべての合法手を生成。
・それぞれの指し手を100回ずつplay out。
勝率の一番高かった手を選択。


play out条件
・700手ランダムに進めて、終局しなければ引き分け


というのを実装してみました。


正直、これでも3手読みぐらいの強さはあるかと思っていたのですが、すこぶる弱いです。次に自玉が1手で詰まされるのに受けもしません。たぶん、指し手がランダムなので相手が詰ませにくるとは限らなくて、「詰ませにくるとは限らないし〜」とでも言いたげです。これはさすがにひどすぎます。


棋力改善のため、モンテカルロ将棋の先輩たちのブログをこっそりと覗き見したところ、少なくとも次の5つをやらないとR1500程度にも満たないっぽいです。


1) play outは早めに打ち切る。(300手を超すようなplay outの勝敗にはあまり意味がない。)
2) SEE < 0の指し手は選ばない(選ぶ確率を下げる?)
3) UCB1を実装する。
4) 指し手の種類によって確率を考慮して云々。
5) 終端ノード詰将棋探索をする。


なんだかハードル高くないですか?


5)なんて、真面目にやろうと思えばdf-pnが要りますよね。評価関数の設計が面倒なので手軽に出来るかと思ってモンテカルロに手を出すと痛い目に遭うということですね。


ともかく、一つずつ実装していきますからしばらくお待ちください。

トラックバック - http://d.hatena.ne.jp/hiyokoshogi/20111005/1317783515