評価値の違い問題
探索の返値と、PVを下った先で評価関数の値が違う問題ですが、
勘違いしてました。
静止探索では、stand_pat=評価関数ではなく、
stand_pat=評価関数+SEE/2
ということで脅威的に軽く足してるので、PV末端で評価関数を呼んで一致するわけがない(^^;
ということで合わせて比較してみたところ200局ぐらいまで一致していて
でも一致しない局面が出てきました。
121手目 手番:先手 進行度=15/15 ▼v銀 9 8 7 6 5 4 3 2 1 ---------------------------+ v香v桂 ・ ・ ・ ・v金v桂v王|一a ・ ・ ・ ・ ・v金 ・v銀v香|二b v歩 ・ ・ ・ ・ ・ ・ ・ ・|三c ・ ・ ・ ・ ・ 歩 ・v金 ・|四d ・ ・v歩 ・ 全 桂v歩v銀 歩|五e ・ 歩 ・ ・ ・ ・ ・ 玉 ・|六f 歩 ・ ・ ・ 歩 ・ ・ ・ 香|七g ・ ・ ・ 龍 ・v歩v馬 ・ ・|八h 香 ・ ・ ・ 角 ・ ・ ・ 桂|九i ---------------------------+ △ 歩九 金 飛 棋譜の手=▼25歩打 ▼25歩打△25銀▼25銀 EVpro=29997 EVpro2=386
詰みがからむ局面です。
学習用は1手詰めを読んでないので、詰みが発生するのは
王手されて受けが無くなった場合です。
29997ということはおそらく3深さで詰みになっていると思う。
問題はこの差がどう学習に影響するのか?