tanuki- 2024-04-30 halfkp_1024x2-8-64 実験内容 halfkp_1024x2-8-64 ネットワークを学習させ、レーティングを測定する。 ランダムパラメーターからの学習には、 Hao を用いて生成した学習データを用いる。 棋譜生成 ランダムパラメーターから学習させる際の学習データ 生成ルーチン tanuki-棋譜生成ルーチン 評価関数 Hao (tanuki-.halfkp_256x2-32-32.2023-05-08) 1手あたりの思考 深さ最大 9 思考ノード数最大 50,000 ノード 開始局面 foodgate の 2020 年~ 2021 年の棋譜…