Hatena::ブログ(Diary)

やねうらお−ノーゲーム・ノーライフ このページをアンテナに追加 RSSフィード

電王戦出場記念! 書籍化されたで! 監修したで!(`ω´) 絶版なってしもた 絶版プレミア価格 記事書いたで!
解析魔法少女美咲ちゃん マジカル・オープン!

YaneuLabs / やねうら王公式 / やねうらおにメール / twitter / プロフィール

 

2014-11-01 やねうら王 対局 実況用スレッドその1

[] やねうら王 対局 実況用スレッドその1  やねうら王 対局 実況用スレッドその1を含むブックマーク  やねうら王 対局 実況用スレッドその1のブックマークコメント


■ 2014/11/01 9:40 朝食きぼんぬ


Aperyの平岡さんが、朝食が出るらしいので食べずに出発とかツイートしてたのを見て、ああ、ドワンゴからメールにそんなこと書いてあったなーと思って、私も食べずに出発したんですけど、何の手違いか、ドリンクはあるものの朝食はありませんでした。同じ考えで会場に臨んだ乞食ども開発者の皆さんがお腹をすかせておられます


■ 2014/11/01 9:45 やねうら王セットアップ


やねうら王の最新の評価関数バイナリAWSから持ってきました

イテレーションを繰り返した結果、指し手一致率はじわじわ上がっているようです。


io_log.txt(62): << Prediction(%) = 41.6054, 61.9203, 72.6732, 79.4686, 84.0842, 87.3918, 89.838, 91.6833,

io_log.txt(1755): << Prediction(%) = 41.9246, 62.4112, 73.2154, 80.0171, 84.6325, 87.9142, 90.3201, 92.1287,

io_log.txt(3448): << Prediction(%) = 42.1614, 62.7542, 73.6011, 80.4009, 85.0059, 88.2706, 90.6613, 92.4509,

io_log.txt(5141): << Prediction(%) = 42.3413, 63.0117, 73.8808, 80.6795, 85.2874, 88.5317, 90.8986, 92.6651,

io_log.txt(6834): << Prediction(%) = 42.4897, 63.2272, 74.0991, 80.915, 85.5045, 88.7343, 91.0797, 92.8262,

io_log.txt(8527): << Prediction(%) = 42.6249, 63.3802, 74.3008, 81.1083, 85.7, 88.916, 91.2505, 92.9872,

io_log.txt(10220): << Prediction(%) = 42.7127, 63.5457, 74.4652, 81.2769, 85.8503, 89.0635, 91.3745, 93.1004,

io_log.txt(11913): << Prediction(%) = 42.8187, 63.692, 74.6055, 81.411, 85.975, 89.1824, 91.4833, 93.207,

io_log.txt(13606): << Prediction(%) = 42.9036, 63.7816, 74.7375, 81.5363, 86.0963, 89.2827, 91.5799, 93.2872,

io_log.txt(15299): << Prediction(%) = 42.9647, 63.9085, 74.8365, 81.6498, 86.1959, 89.3866, 91.6706, 93.3685,

io_log.txt(16992): << Prediction(%) = 43.0124, 63.9985, 74.933, 81.7517, 86.2941, 89.4678, 91.7522, 93.4477,

io_log.txt(18685): << Prediction(%) = 43.082, 64.0796, 75.0252, 81.8341, 86.3674, 89.5391, 91.8177, 93.5024,


■ 2014/11/01 9:45 やねうら王、過学習っぽい?


指し手一致率43.082%。候補8つまで入れると棋譜の指し手と一致している率は93.5024%。高すぎます。どうも過学習っぽい気もしますが…。本当は対局して前のバージョンより勝率が上がっていることを確認すべきですが、その時間はありません。これで驚異的に強くなっていることに賭けるより他ないです。


■ 2014/11/01 9:50 なのは(Calamity)が止まる


なのはの作者が自己対戦中に止まるとか言ってます。「calamity」の名の通り、「大きな災難」がやってきたんでしょうか…。


Calamityは、Stockfishの探索部になっており、評価関数学習も1からやっているので、Bonanza6には8割以上勝ち越す強さでしょうし、Calamityが優勝する確率も5%〜10%ぐらいあると思うんですよ。みんなノーマークみたいですが…。逆にこの大会ルールだとPonanzaが5位にさえ入れない確率10%ぐらいあると私は思ってます


今回はCalamityと同じ強さのレベルのソフトがたくさんあるので、今回の大会は荒れそうです。


■ 2014/11/01 10:25 朝食きました!


お腹をすかせた乞食ども開発者の皆さん、歓喜!

いまから対局のテストが始まります


■ 2014/11/01 10:30 対局テスト中..


やねうら王、置換表のメモリ確保に失敗してることに気づきました。4096MBより大きなメモリ指定すると確保に失敗します。Windows8がらみの問題なのかなぁ…。うーむ..64GBあるのに4GBしか使ってないという…。まあ、動くだけマシか。あとで原因を調べよう..


■ 2014/11/01 10:47 うわ!


やねうら王がおかしい手を指してます。明らかにバグってます

将棋所がらみかWindows8がらみかわかりませんが…。


Windows7に変えるにはインストールDVD持ち込み(or 明日以降)とのことだそうです。あわわわわ。


→ 評価関数のテーブル自体は読み込めているようなので、まあ…このまま頑張りましょう…。


頑張れ、俺(のソフト)。負けるな俺(のソフト)。


■ 2014/11/01 11:05 バトンタッチ将棋


一昔前は将棋ソフトは序盤が初段、中盤が県大会優勝レベル、終盤がプロ級で、棋力の違う3人に次々とバトンタッチしていく、バトンタッチ将棋だと揶揄されたものですが、最近ソフトのほうも強くなってきて、序盤県大会優勝レベル、中盤プロ級、終盤宇宙人(人外の勝負!)となっているのではないかと思います


■ 2014/11/01 11:10 今回はAWAKE・Aperyが優勝候補だと思います


AWAKEの作者に尋ねたところ、AWAKEはKPPを次元下げでKPA(A=利き)をやっているらしい。あー、その発想はなかったわ…。そうか…これには脱帽。今年AWAKAが優勝したら来年はみんな次元下げKPAをやるだろう…。これはビッグウェーブだ。


Aperyのほうは、KPPに手番を考慮するようにしたが強さは微妙だったので手番の考慮はやめたとのこと。


■ 2014/11/01 11:12 いきなりやねうら王 vs Ponanza


いきなり今年のPonanzaの本気が見れるのか!!!なんぞこれ!!


■ 2014/11/01 11:16 つづき


やねうら王側は定跡手順(やねうら未来定跡)。後手の初手32銀。遠山五段いわく「人間なら、これで先手良しですが…」とのこと。ずいぶん変則的な形だがさすがにPonanzaはきちんと対応してくるのな…。これでPonanza対応してくるなら、予選抜けてPonanzaに当たったらこの定跡採用しないほうがいいな…。やねうら王側は予選抜けれるかどうかすら怪しいが。


そうこうしているうちに角・銀交換に。


遠山五段「やねうら王、序盤・中盤・終盤、スキだらけですねー」


やねうら王側はまだ形勢をほぼ互角と見ています果たしてどうなのか…。これは過学習の結果なのか?


52手目でやねうら王の長考。やねうら王はまだほぼ互角と見てます。本当、なんなのか、この将棋…。Ponanzaも傷があってもしかして難しい形勢なのか?


やねうら王のほう、そろそろ時間を使い切りそう。10秒での秒読みのテストしてないんですが、今回は大丈夫なんでしょうか…。例によって、事前にその部分テストできなかったので、わからないんですよね…。


■ 2014/11/01 11:40 やねうら王、秒読みきちんと動いてます


9.7秒まで思考してます。秒読み切れ負けしないかヒヤヒヤします。


やねうら王は形勢をまだほぼ互角と見てますしかし秒読みなので指し手が乱れてきそうです。


遠山五段「Ponanzaは+793。Ponanza優勢でしょう」


やねうら王側、評価値-410。やっと形勢が悪いことに気づいたみたいです。遅すぎ。


■ 2014/11/01 11:47 やねうら王側、(去年に続き)また時間切れ..


9.7秒まで読むと時間切れになってしまいました。

9.0秒に変更してみますが、これまた例によって駄目なような気が…。


対局のときサーバーから持ち時間設定が送られてくるので、こちらで秒読みの設定がUIから出来ないんですよね。プログラム書き換えて、強制的に9秒と解釈するように変えてしまうぐらいしか…。


サーバー側、ネットワーク遅延とか考慮して時間切れに対して0.数秒のマージン用意して欲しいです..。


とりあえず、今回駄目なら、コンパイルしなおして秒読み8秒設定に変更します。



■ 2014/11/01 12:10 ネットワークトラブル


ネットワークトラブル(サーバートラブル)があって、開始の合図が二回送られてきたようです。5分後にやりなおしということになりました。


やねうら王のほうは、"byoyomi"を8秒と強制解釈するように修正してコンパイルしなおした実行ファイル差し替えました。動作テストのための時間が1分もなかったので、これでうまく動くかどうかはわかりませんが…。


これでうまく動くなら、このネットワークトラブルはやねうら王を差し替え時間が出来たので幸運でした。


またやねうら王のやねうら未来定跡はオフしました。Ponanzaに通じなかったので萎えました…。ああいう変な局面にも初見対応してくるPonanza対応力は、さすがですね。次は正攻法でいこうと思います


■ 2014/11/01 12:25 全対局再スタート


サーバー側のトラブルのため全対局再スタートだそうです。


やねうら王、定跡を切ったので初手から考えてます思考時間的にはめっちゃ損です。こりゃ下手するとCalamity相手に負けもあるでー。(笑いごとじゃない)


なんかメモリ確保に失敗しているっぽいので評価関数ファイルのいずれかが読み込めてない可能性も…。うーむ。Windows8めー。



■ 2014/11/01 12:28 思考時間5分無駄にした


Calamityは定跡手順のようで19手目まで1手1秒。やねうら王のほうだけ一方的に5分ほど損しました。これ負けたら、もう帰りたい…。もう今日大惨事ですわ…。


■ 2014/11/01 12:53 Calamityに勝利


やねうら王側、飛車をタダ取りできたものの、形勢は互角ぐらいだったようです。(ソフト的には)


やねうら王側は時間的にも危なかったみたいですが、やねうら王なんとか勝ちました。やねうら王、秒読みで1手8秒(計測)で指せてたので修正は正しく出来ているようです。



定跡このあと使うかどうかは考え中..。


■ 2014/11/01 13:20 将棋所もWindows8悪くなかった


原因がわかった。将棋所もWindows8悪くなかった。悪いのは私だった。開発環境が16GBしかメモリ載ってないので、8GBまでしか置換表を確保するテストしてなかった。16GB確保できないのはコード上の問題で、以前この部分書いたとき高速化のために8GBを上限として設計したのだった…。つまり、私の意図通りだった。ここのコード書いたときには64GBもメモリがある環境で動かすことは想定してなかった。


そんなわけで置換表は8GBを指定するとちゃんと確保できた。さっき欲張って32GBを指定して確保に失敗して首を傾げてた。また評価関数はたぶんちゃんと読み込めている。たぶん…。


■ 2014/11/01 13:40 秒読み8秒で指す部分


0分10秒設定でやると、なんか初手で10数秒思考して時間切れになる。初手の処理おかしいな。突貫工事修正したのでなんかおかしいのだろう。今回は15分10秒設定なので問題ないと思うが…さすがに自信なくなってきた。もうしんどい…。帰りたいでござる…。


余談ではあるが会場が辺鄙なところにあって、近くは安いホテルカプセルホテルしかなかったんだよ。周りのいびきがうるさくて眠れないんだよ。初日から疲労マックスなんだよ。お腹痛いでござる。もう帰りたいでござる。


■ 2014/11/01 14:10 やっぱり原因わからんでござる…


開発環境(Windows7)では問題なく動いているのでWindows8スレッドスケジューラーが関係しているような気はするが他のソフトはみんなきちんと動いている(?)ようなのでやっぱりそのへんの私の書き方が悪いんだろうな…。


うさぴょんの作者は、Windows8だと独自UIが動かなかったらしく、自前のWindows7インストールしていた。いろいろ大変そうである


タスクマネージャーで見たらAntimalware Service ExecutableとかMicrosoft Windows Search Indexerとか悪さしそうなプロセスが走っている。これ大丈夫なのかな…。


やねうら王側のponderが絡む秒読み計測のバグのような気もする。これで駄目だったら次はponderやめる。もうgdgdだよ。疲労マックスなのでもう寝たいよ…。ponder+秒読みのテストって普段やらない組み合わせなので何かバグがあったんだろうな。


■ 2014/11/01 14:12 やねうら王 vs labyrinthus


labyrinthusは筋違い角。しかも定跡に入っているようで、ここまでずっと1秒。やねうら王は例によって5分消費。5分消費は痛いが、それより、秒読み入って切れ負けバグで負けそう。


あれ…。labyrinthusずっと思考時間1秒だぞ…。ずっと1秒思考ってこと?なにこれ??


こういうソフトなの?


これ逆に、やねうら王、なんか切れ負けバグが出そう。相手が10秒以上思考してくれると切れ負けにならないが、相手が即指しだとさっきのバグが出るような気がするんだよな…。


これ負けたら棄権して帰ろうかな。もうしんどいよ…。


■ 2014/11/01 14:20 秒読み=0と解釈するように修正する


いまのうちに秒読み=0と解釈するように修正する。


■ 2014/11/01 14:30 labyrinthusに勝利


バグはおきなかった…が、やねうら王、思考時間8秒で停止するはずが9秒使ってるところあるぞ..。これ、持ち時間が切れて秒読みに入るときバグか..。思考時間、秒読み5秒設定に変更する。


最後まで無事指せたらなんでもいいや…。


■ 2014/11/01 14:40 labyrinthusの作者に聞いてみた


labyrinthus、作者の方に尋ねたところ1秒思考は「負けるのわかっていたので時間攻め」をしたとのことでした。いやー、本当に危なかった。(バグって負ける的な意味で)


本当、やねうら王に時間攻めは、最高の作戦だしたぞ!


■ 2014/11/01 14:55 AWAKE vs Aperyは引き分け


AWAKEが必勝のまま256手ルールに引っかかり、引き分け

Aperyの平岡さんは少しニヤけ顔。


個人的には、256手ルールと秒読みはなしにして、15分切れ負けにしてもらえたほうが時間スケジュール通りに進行していいかと思うんですけどねー。


15時なのにまだ3回戦が終わったところです。(本日、残り5回戦あります)

4回戦は15:10から


■ 2014/11/01 15:00 今日のやねうら王はもしかしてラッキーだったのか?


時間切れ負けのバグを初戦のPonanza(もともと実力負け)で起きたことで、そんなに痛くないマイナス。そのあとバグが出ずに2局拾えて、裏街道ルートに入ったのかも知れない。


このあとの試合次第では本戦進出、あるで〜。(秒読み、1手5秒にしてあるけどな…)

もう最後まで指せれば何でもええのや〜。


※ 眠さと疲労が限界に達したので精神的に壊れております



■ 2014/11/01 15:00 きふわらべの人


きふわらべの人が左の席にいるんだよ!

聞いてみたところ、「きふわらべ、まだ将棋ルール通りに指せない」とのこと。


お、、おい、そんなソフト出てきていいのか!


この大会、ちゃんと事前に思考エンジン送って審査すべきじゃないか。

秒読みとかちゃんと守れないソフトはお呼びじゃねーんだよ!(俺のソフトのことだよ、俺の…なんかごめん…)


■ 2014/11/01 15:10 メカ女に入りたいです…


メカ女、なんか無料キャバクラみたくなっているのが非常に羨ましいので「メカ女に入って開発のお手伝いしたいです!」と言ってみたところ、「女子枠でいいならどうぞー」とのこと。女装しろってこと?え、、あ、、ごめん。やっぱいいです。


■ 2014/11/01 15:15 やねうら王 vs N4S


N4SはKKPPの学習をされているそうです。評価関数は15GB。三角配列を用いて節約しているもの学習には45GB(48GB搭載マシン or 64GB搭載しまん)積んでいないといけないそうで…。


とか言ってたら局面は相振り飛車、やねうら王側、穴熊からの猛攻。この攻めは決まってるのかな…?どうなの…。


N4Sのほう、NDFみたく相対にも次元下げすることと探索部を改良して、5月選手権バージョンからさらにR100ほど上がっているそうです。


■ 2014/11/01 15:34 やねうら王秒読みに


やや、やねうら王有利?の終盤ですが、やねうら王が秒読みになってしまいました。しかも5秒設定なので1手4秒しか使いません。これではさすがに逆転してしまうのでは…。


秒読みまわりのバグ、本当にもったいないなぁ…。


■ 2014/11/01 15:44 やねうら王、負けました


秒読み4秒 vs 持ち時間残り5分+9秒の違いが出て、終盤の大事なところで逆転したっぽいです…。N4S側の評価でもやねうら王有利となっていたとのこと。


まあ、仕方ないですな…。


■ 2014/11/01 15:55 今回の本戦出場の条件は?


たぶん今回の本戦出場の条件は4勝4敗で、あとはソルコフ勝負。となれば同じ4敗ならPonanzaとかN4Sのような強豪に負けているほうが有利!よしよし、いけるいける!


※ 疲労が限界値を超えたため、謎のポジティブ思考モード突入


■ 2014/11/01 16:00 激指 vs やねうら王


今度は激指だと…。やねうら王、強豪ばっかり当たるやないか!


まあ、今回、強豪ソフト多すぎるんだよな…。強豪ソフトとばっかり当たるのは当然だな。


それはそうと、定跡オフにして秒読み1手4秒だとR100ぐらいの差が発生するな。やねうら王にこれを跳ね返すほどの棋力があればいいのだが…。


■ 2014/11/01 16:06 Apery平岡さんのAWAKE


私   「AWAKEのKPAって画期的じゃないですか?」

平岡さん「利きを評価しすぎるので、自陣に駒を集めるのを高い点数をつけるようになるので(さっきのApery vs AWAKE戦のように)良し悪しあるのでは?」

私   「ああ、受け棋風になっちゃう、みたいな?」

平岡さん「でもやってみる価値はあると思いますよ」


■ 2014/11/01 16:30 激指に勝ちました


激指 vs やねうら王、やねうら王勝ちました。定跡なし&秒読み1手4秒で…。

角換りで短手数の将棋になって秒読みまでに優勢になったのが良かったのかも知れません。


■ 2014/11/01 17:15 習甦 vs やねうら王


習甦の作者いわく、「去年からあんまり強くなってません。強くしたかったんですけどねー」とのこと。


去年の電王トーナメントでは、テストモード将棋でやねうら王と当たったのですが、そのあとは当たっていないので初めての対決です。


いま、46手目。やねうら王側はずっと+100〜+200の点数がついていますが、ほぼ互角の将棋だと言えるでしょう。


■ 2014/11/01 17:20 習甦戦、やねうら王側の構想


26歩突いて、38銀として39に玉を囲う(28飛のまま)のは、やねうら王がよくやる戦法です。結構やれるようです。今後、こういうの流行るかも知れませんね。(プロ将棋で通じるのかはわかりませんが…)


いま63手目。形勢はほぼ互角と、やねうら王は見ているようです。


いま72手目。やねうら王、ややよし(+200〜+300)と見ていますが、時間が双方なくなりそうです。このねじり合いで秒読み4秒 vs 9秒は勘弁して欲しいものがありますが..


93手目。やねうら王優勢。習甦側、手がかりがないのでこれなら秒読みでも逆転はしにくそう…。


習甦 vs やねうら王、194手にてやねうら王の勝ち。


やねうら王、これで本戦進出ほぼ確定?



■ 2014/11/01 19:00 やねうら王 vs Selene


Seleneのほうは、探索部は(Stockfishと)ごちゃまぜ、評価関数はKPP + 相対とのこと。Calamityあたりと同じぐらいの強さなのかな?


序盤でSelene側の模様が取りにくくなったのでやねうら王側、じわじわ良くなったようです。このへん、コンピューターには苦手なタイプの序盤なんでしょう…。


遠山五段「66歩と(先手の)玉のコビンが空いたのは(後手にとって)大きな手ですね。」


そんなわけでSeleneに勝利!


■ 2014/11/01 19:10 秒読み4秒の件


実は今回の対局条件、会場に来るまで知らなかったんだ。朝食なくて、お腹すいて死にそうだったので、そのことしか頭になかった。気づいたらこんな状態だった。「去年と持ち時間ルールとか同じなんだからわかるだろ」と言われそうだが、私はそんなこときちんと覚えている人間じゃないんだよ。(威張って言うこっちゃないが)

ホテルの予約をしたのは1ヶ月前で、今日の会場もどこか忘れてたので今日、「電王トーナメント 住所」でググってここにきた。それが私だ。


■ 2014/11/01 19:30 やねうら王 vs Apery


やねうら王、現在2位。(1回戦で遠山五段からボロクソ言われていたのに、ここに来て「やねうら王、強いですねー」と高評価に!)


Apery戦の局面はほぼ互角のまま斬り合い。現在82手


やねうら王のほうは弱いソフトに千日手で引き分けになるとソルコフで損するかと思い、千日手は無理にでも打開するように設定していた。Apery戦は逆に、千日手は打開は無理せず局面のスコアにゼロ点を付けるべきであった。(Aperyはその設定)


私はそんな設定は忘れていた。中盤で、千日手になる変化を自ら打開してしまった。これで負けたらその設定をし忘れたことが敗因と言えるだろう…。


■ 2014/11/01 20:05 Aperyに負けました


終盤、激戦。やねうら王の17玉とかヒヤっとさせる手。


平岡さん「Aperyの頓死ありえますね…」


と言っていたのですが、Aperyがうまく受けきってAperyが見事に予選2位に!こっちは4秒将棋なのにAperyに3分以上時間が残っていたのも大きいと思うが、しかし形勢はやねうら王が悪かったので、順当な結果だろう。


■ 2014/11/01 20:15 結果


やねうら王は予選3位通過!応援してくださった皆さん、ありがとうございます


山岡「また明日来てください。明日には、AWSでさらにイテレーションを回した、さらに強いやねうら王を味あわせてあげますよ」

チャモアンチャモアン 2014/11/01 12:18 時間切れびっくりしました。
差し替えで上手く動くといいですね!

チャモアンチャモアン 2014/11/01 12:36 メモリ、持ち時間、独自定跡と三重苦ですか。
取り敢えず、無事に終局まで指せると良いですね。

電王戦5対5でやねうら王がみたいから頑張って欲しい

ところてんところてん 2014/11/01 12:43 未来を見せて下さい!

観戦者観戦者 2014/11/01 12:43 最後まで完走する事、応援してます

やはり突貫開発は本番が厳しいですなぁ…
当日使用機のOSは予めわからなかったんですか?
出来れば事前に動作確認くらいはしておきたかったですね

nanashinanashi 2014/11/01 13:09 出来ればもう1局ぐらいは未来定跡が見たいですね

KK 2014/11/01 13:11 負け将棋でトラブル出てくれたのはラッキーと考えませう
勝ち将棋で時間切れはダメージ大きいですから…
応援してます。頑張って!

チャモアンチャモアン 2014/11/01 13:12 初勝利おめでとうございます

BTRONBTRON 2014/11/01 13:22 応援しています!!!
トラブルで厄落としが出来ましたね!!
母胎のトラブルでトラブルと認めてくれたのは有り難かったと思量します。

BTRONBTRON 2014/11/01 13:34 把握が早いw

BTRONBTRON 2014/11/01 13:35 ぜひ電王戦に出てくださいね。
他の強豪ソフトはBonanzaシスターズでStockfishブラザーズだからつまらないです。

ななPななP 2014/11/01 13:59 超ガンガってください!(笑)

ななしななし 2014/11/01 14:06 置換表は一晩あれば修正出来るんですかね?
なんとか今日の予選乗り切って、明日から本気のやねうら王で勝ち進んで電王戦に出てほしいです。

BTRONBTRON 2014/11/01 14:54 おめでとうございますw

MacMac 2014/11/01 15:01 対局中に設定変更していいの?

玄関口王玄関口王 2014/11/01 15:17 なぞなぞ認証、なぞなぞ出してくれないのが不満です。
↑電王トーナメント1週間後までは改変OKだったはずです。

R_XeonR_Xeon 2014/11/01 15:45 終盤惜しい将棋でした.
秒読み5秒はさすがに厳しいのかもしれないですね.
7.7秒くらいで安全かなと思ったんですが...

赤 2014/11/01 15:52 8秒から一気に5秒まで縮めるのはずいぶん極端な気がしますが、
何か事情があるのでしょうか

furyfury 2014/11/01 15:58 次は激指とですか・・・。
辛い戦いが続きますね。なんとか勝ってほしいです!

ジャックジャック 2014/11/01 16:47 やねうらさん、がんばって(しなないで)下さい。

BTRONBTRON 2014/11/01 17:04 やねうら王は定跡使えない上に秒読みバグで早指しになっちゃいましたね。

kijibatokijibato 2014/11/01 18:22 秒読み不具合、明日までに直せるといいなぁ。
原因、推測できてないと辛いですけど。

ジャックジャック 2014/11/01 18:40 ↑明日から2時間切れ負けのルールになるから
秒読みの不具合直す必要ないと思うよ。

ろ過ろ過 2014/11/01 19:15 やねちゃんいけるやん。
明日に備えて徹夜調整かな。

R_XeonR_Xeon 2014/11/01 19:16 現在2位ですか〜スゴイですね.
ただ最終戦Apery戦くらいは秒読みもう少し増やしてほしいなと思ったり
それにしても流石です

YakitoriYakitori 2014/11/01 19:18 すごいじゃないですか、折れてますよ死亡フラグ。
最後に勝つのは地頭ですかね。PG力の勝利ですかね。
最後も期待してます。

AdhocAdhoc 2014/11/01 19:24 負けても言い訳がいくらでもきくような設定になっているにも関わらずしっかり勝っていてすごいです。
開発方針の正しさは証明されたと思いますので、調整頑張ってください。

チャモアンチャモアン 2014/11/01 20:23 予選3位おめでとうございます。
長時間お疲れ様でした。

ぐっきーぐっきー 2014/11/01 20:28 お疲れ様でした。
おっしゃっていた状態で予選3位通過とは今後が楽しみです。
本気の強いやねうら王に期待しています。

R_XeonR_Xeon 2014/11/01 20:31 3位おめでとうございます.
ただこれは死のグループに行っちゃいましたね
4位の方が結果的にはよかったけど、明日も頑張ってください

furyfury 2014/11/01 20:32 長時間お疲れ様でした。
激戦区に入ってしまったようですが、明日も楽しみにしています。

furyfury 2014/11/01 20:32 長時間お疲れ様でした。
激戦区に入ってしまったようですが、明日も楽しみにしています。

furyfury 2014/11/01 20:32 長時間お疲れ様でした。
激戦区に入ってしまったようですが、明日も楽しみにしています。

furyfury 2014/11/01 20:32 長時間お疲れ様でした。
激戦区に入ってしまったようですが、明日も楽しみにしています。

furyfury 2014/11/01 20:32 長時間お疲れ様でした。
激戦区に入ってしまったようですが、明日も楽しみにしています。

YakitoriYakitori 2014/11/01 20:38 すべてをなげうった本気。期待してます。

トラックバック - http://d.hatena.ne.jp/yaneurao/20141101

2014-10-31 やねうら王開発実況用スレッド その3

[] やねうら王開発実況用スレッド その3  やねうら王開発実況用スレッド その3を含むブックマーク  やねうら王開発実況用スレッド その3のブックマークコメント


■ 2014/10/31 6:30 人間棋譜からのみの学習


一昨日に書いた、私の対局棋譜16局のみで学習させる件ですが、評価関数パラメーターの初期値はゼロです。やねうら王2014の評価値とは何も関係ありません。 全くのゼロから学習です。


ついでに言うと「初段〜3段ぐらい」になったと書きました。24のRで言うとR1500〜2000ぐらいという意味ですが、もともと駒得だけの評価関数でもR1600〜R1800ぐらいあるので、別にさほど強くはなっていません。


人間の少ない対局棋譜から棋風を学習するという部分が面白く、また、少ない棋譜から学習できるということがエポックメイキングなのです。まあ、この価値は、わからない人にはわからないでしょうけども…。


人間場合子供将棋を覚えてプロ棋士になるまでに何万局も並べるわけではありません。もっと少ない対局数から学習できます。それは、人間の汎化能力が優れているからで、その源泉がどこにあるのかを私は考えていました。


それはつまり次元下げなのです。


人間場合、適切に次元を下げ、その下げたパラメーターを適切に学習するのです。IQ(知能指数)によって、その次元の下げ方および学習の仕方に差はあります。それゆえ頭のいい人間と悪い人間とが分かれます。


それはこの次元を脳が下げて学習するというプロセス化学的な反応が関与していて、その化学的な反応を促進するための物質が適切に放出されるかという点には遺伝子的なものが関与しているからだと私は考えていますが、それは私の仮説に過ぎません。


ともかく、機械学習場合、適切に次元を下げると人間に近い学習が出来るようになると簡単に言えばそういうことです。


■ 2014/10/31 7:00 評価関数パラメーターの初期値


評価関数パラメーターの初期値をやねうら王2014のものから学習させたのでは、人間棋譜を参考にしていないことにはならないのではないか」という意見があります。(特に開発者ではない人から)


開発者の人は、初期値をどうとろうが、ローカルミニマムに落ちない限りは数回イテレーションを回せば値がごっそり変わることは知っています。要するに適切ではない方法学習させれば、学習のためのイテレーションを数回まわすだけで極端に弱くなります。初期値はあくまで初期値です。step 32なら1イテレーションで最大64も評価因子の値が変動します。10回まわすだけで最大640も変動します。元のものとは全然違ってきて当然です。


逆に適切な方法学習させれば、学習のためのイテレーションを数回まわすだけで極端に強くなります。その顕著な例はBonanzaです。Bonanza6ではdepth = 1(≒ 読みの深さ = 2手)で3ヶ月ぐらい回してある程度の値に収束させたあと、最後の仕上げだけdepth = 2(≒ 読みの深さ = 3手)で回しています。*1


このdepth = 2で回すことで(これにより前のバージョンからの棋力が向上したのであれば)R150程度向上していることになるとYSSの山下さんが以前、YSSの掲示板に書いておられました。


何故depth = 2にするとそんなに強くなるのでしょうか。「depth = 1から2に増やせば強くなるのなら、depthを上げれば上げるほど強くなるのではないか」という考えも自然ものだと思いますが*2、depth = 3で私がやってみましたが、棋力はわずかに向上するものの、結局は誤差の範疇でした。


2008年ごろ、激指オンライン学習を用いていて、もっと深いdepth(噂では8手読み)で学習させているという噂もありましたが、私はよく知りません。


現実的にはdepthを1増やす学習に2,3倍の時間を要するようになるので、ここで2,3倍の時間を使うなら、棋譜の数を2,3倍にしたほうが棋力の伸びは顕著でしょう。


Ponanzaチームの下山さんは「root(探索開始局面)からまり手数を進めると駒の配置などが全然違う局面になってしまい、その差を学習させるような(ボナメソのような)学習方式では、うまく学習できないのでは」と言っていました。


そのためか、現在ではNDF(たぶんPonanzaも)のように、大量の局面から学習させる方式が上位ソフトでは主流のようです。今後のことはわかりません。いまこのブログを読んでいる読者が新たな手法を開発しないとも限りません。


■ 2014/10/31 7:30 今回のやねうら王のPR文について


1) やねうら未来探索


・探索部は主にStockfishを参考にしている。

・GPSfishを参考にしていた部分(GPSチームの独自実装)は、全部やめた。

Bonanzaの1手詰めをコメントアウト。ただ、R70ぐらい下がるので代わりのものを簡単に用意した。まあ、元の1手詰めと棋力はそんなに変わらないと思う。

Bonanzaの3手詰め(?)、AWAKEは入れているようだが、やねうら王2014には元からそのコードを書いていない。これを入れて強くなるのかどうかは正直私にはわからない。Ponanza山本君いわく「(Bonanzaの3手詰めでやっているような遠方から王手して延々中合いして手数が延長されるような簡単な詰みは)どうせただで駒を取れる場合はそちらを優先的に読むのでその3手詰めはあまり意味ないのでは」とのことだが…。


2) やねうら未来定跡


これは今年の5月将棋倶楽部24に参戦しているとき自己学習で作った定跡を用いる。


3) やねうら未来学習メソッド


これは、何度も書いてきた評価関数次元下げ。KPPを128通りに分解する。ただ、学習イテレーション時間がかかりすぎるので今回は16に変更した。


また棋譜から学習メソッド独自のものになっている。ボナメソ(Bonanza6の実装)自体は、機械学習方法としてはさほど優秀でもないので、なかったらないで特に困らないと私は考えている。


仮に保木さんがいなくて、ボナメソが発明されてなくても、機械学習手法から似たことをする人は出てきていただろうし(NDFとかボナメソじゃないし…)、「ボナメソが引き起きしたコンピューター将棋ブレイクスルー」という認識自体が間違っていると私は考えている。


無論、保木さんの登場(およびBonanza6のソースコードの公開)で、コンピューター将棋評価関数パラメーターの学習機械学習が使えることが実証され、それによりコンピューター将棋進歩が加速したことには違いないのだが。



■ 2014/10/31 8:30 将棋所とBonadapter


将棋所、去年の開発時には切れ負けが実装されていなくて、また手数での終局もなかったので連続自己対戦をして勝率を調べようにも試合が終わらないことがあった。これでは将棋ソフト思考エンジンの開発には使えない。


将棋所の開発者思考エンジン開発者ではないから、その必要性がわかってもらえないのかなとも思ったものだったが、その後の将棋所のバージョンアップによって、最新の将棋所ではその二つの機能完璧実装されている。*3


同じく、去年の開発時には、Bonadapterも初手を返すときBonanzaが長考することがあり(思考時間を守らないバグのようだった)、これまたBonanza連続対戦させるときに困ったものだったが、このバグも最新のBonadapterでは修正されている。*4


どちらも自分的には神アップデートだ。作者に感謝!!最高だ!!

思考エンジン開発者的にはこの2つのアップデートは凄く嬉しい。



■ 2014/10/31 9:00 よわコミュの姫


短い時間自己対戦させていると飛車が横歩取って狭いところで詰まされて死んだりするのだが(横歩を取る段階では死ぬところまで読み切れてないのだろう)、さすがにアマチュア初段(R1500)レベルでもこれはない。仮にも人類未踏のR3400クラス将棋ソフトだぞ?ヤムチャピッコロぐらい違うんだぞ?ありえんだろ…。


こんな負け方をするところをニコ生で配信したら、「よっわwコミュ抜けるわw」と野次られるだろう。次の日には「よわコミュの姫」(やねうら王のイメージキャラクター女の子なんです)*5という名前ネット中を駆け巡りかねない。



■ 2014/10/31 9:30 羽生さんと対戦したいだと?


なんか、Ponanza山本君が羽生善治名人と戦うためにクラウドファンディングで7億集める道を模索したい*6と書いている。


上位のソフトは事前貸出なしの条件であればとっくに羽生さんを超えていることは誰の目にも明らかである。超えているとは言ってもソフトから見て勝率50%は超えるだろうという程度の意味で、勝率が90%とか100%とかではないので試合としては成立すると思うが…。


しかし、事前貸出1年間だとか、そういう条件がつくならとんでもない茶番であり、羽生さんがゲーム攻略よろしく将棋ソフトの序盤のあら探しに終始することになる。羽生さんのような優れた頭脳を1年もそんな遊びに投入させるべきではない。それこそ社会的損失である


とは言うものの、対局自体は旬のうちに見てみたいのでクラウドファンディングお金集めるなら私も10万円ぐらいなら出すけどナー。でも羽生さんの負けるところは見たくないなぁ。個人的には、羽生さんに対局して欲しい気持ちと、対局せずにこのまま逃げ切って欲しい気持ちと半々だな…。


■ 2014/10/31 10:00 移動しまーす


いまから移動の準備をするので続きは明日


■ 2014/10/31 13:50 広い概念を先に学習させるべき


保木さんが昨年、KPの学習をさせてからKPPの学習をさせると早く収束するということを学会誌に書いてたのだけど、もっと一般化して言えば、大きな、広い概念を先に学習させて、そのあと小さな、狭い、精緻化された概念学習させるということだ。よく考えてみれば人間はそういう順序で学習する。例えば、数学問題を解くときには、なるべく広い概念適用して、それで解決できないときに、より細分化された、その問題固有の条件などを利用して解いていこうとする。


先手の「78金」の形にしても、まずこの形の部分的な良し悪しがあって、別にそんなに悪い形ではないというのがあるが、しかし、後手が振り飛車ときには、先手は78に金がいると舟囲いに囲えないので損だという、特殊化された概念がある。


まあ、そんな前説はどうでもいいのだけど、次元分解して相対KPPを学習させるときも、相対KPPのほうが絶対KPPより広い概念なので、まず相対KPP(あるいは、相対PP)を先に学習させるべきだった。そうすると早く収束する。同じく、さらにKPPを分解するときも、同じ理屈が成り立つ。また、広い概念ほど一回獲得したらあまり値を動かすべきではない。人間もそうだよな…。KPを学習させたあとKPPを学習させるときもKPを固定しておいてもいいぐらいだ(と私は思う)。


いまごろ気づいても今回は、もう手遅れだけどなー\(^o^)/


もしかして、これって機械学習の基本なの?ごめん、知らなかった。私が20年ぐらい前に概念帰納学習とかなんかを勉強してたときに、そんなことが書いてあった気がするんだが、いまにしてその意味するところがわかった。(できれば1ヶ月前にわかりたかった…)


■ 2014/10/31 14:00 お前ら、AWSにいくら使うんだよ!


AWS電気代の10倍ぐらいする。高すぎる。棋譜から学習ときAWSを使う奴は馬鹿だ。AWSジャンジャン使っちゃうAperyの平岡さんも馬鹿だ。平岡さん、一体いくら使ってんだよ!あんた、大馬鹿だよ!!


…と思っていた時期が私にもありました…。いまでは自分も大馬鹿野郎の仲間入りです。\(^o^)/


追伸

来月のクレジットカードの請求書が怖いです。



■ 2014/10/31 18:00 人間棋譜を参考にしない?


今回のやねうら王は人間棋譜を参考にしないことをコンセプトに開発をしている。


人間(プロ棋士)の棋譜がなくともコンピューター将棋は強いのだ」、ひいては「人間なんておらんでも良かったんやー」というのを証明したいと思っている。


そのために自己対戦棋譜のみを使い、その棋譜を使って学習し、強くして、その強くなったソフトでまた自己対戦をして、その棋譜学習しというフィードバックによって強くしていこうと考えている…が、時間的問題もあってそこまで出来ていない。


使っているのは自己対戦棋譜のみではあるが、その自己対戦のために使ったやねうら王の評価関数パラメーターは以前、プロ棋士棋譜を用いて学習させたものであるから、これだと混血みたいな状態である。純血ではない。繰り返していくうちに人間棋譜の影響は薄らいでいくかも知れないが、これをもって「人間なんておらんでも良かったんやー」と主張するのはちょっと苦しい。


棋譜から学習の初期値に以前の評価関数パラメーターを使っているのも、以前の評価関数パラメーターの学習自体にはプロ棋士棋譜を使っているわけだから、これも「人間なんておらんで良かったんやー」の趣旨にはそぐわない。


ただ、後者のほうは、評価関数の形が以前のもの(Bonanza相当)とは少し違うので値をそのまま使えているわけではないし、時間さえあれば(+電気代さえあれば)、ゼロから学習させても同じ棋力のものが出来るのは間違いないので、私はこの部分は特に問題としていない。


むしろ、学術的に問題なのは、本当にブートストラッピング*7可能かどうか。すなわち、ゼロからスタートしてある程度の棋力のソフトが出来るのかどうかだ。


ある程度の棋力のソフトがいったん出来てさえしまえば、そのソフト自己対戦棋譜を使って評価関数パラメーターを学習させ、そのまた自己対戦棋譜で…というフィードバックループに入れる。(NDFはこれに近いことをしていたはず…)


ゼロからスタートする場合、終盤は自己対戦のときに深く読めば詰みが見える局面では正しい指し手を指せるから、終盤の指し手は正しい指し手を生成できる。


となれば、問題は終盤の指し手から中盤、ひいては序盤の指し手を学習できるかである。終盤の指し手や駒の位置関係から、いかにして中盤(序盤)の指し手を学ぶかという話に帰着する。


終盤の指し手から中盤の指し手を学習するためには、終盤に出てくる形をなるべく汎化して学習して、中盤に出てくる形に対応できるようになる必要がある。そのために、ここで次元下げの話に繋がるわけである


終盤の指し手からうまくKPPの次元を下げて学習すれば中盤がうまく指せるようになる。中盤の指し手からうまくKPPの次元を下げて学習すれば序盤もそのうちうまく指せるようになる…というブートストラッピング方法を私は考えたわけであるしかしまだそこまで実証できていない。そのへんは今後の目標であり、私の研究課題である


■ 2014/10/31 18:10 PVの件など..


そういうチャレンジングな部分に私はとても惹かれるわけであるが、視聴者からは「学術的なことなんかどうでもいいしPR文もどうでもいいから、ともかく強い将棋ソフトで出てくれよ」と言う声がほとんどである


今回の電王トーナメントPV撮影ときも、「強くするとか興味ないんです」「この方法ボナンザぐらいの強さになれば大成功なんですけど」と答えたものとか、綺麗にカットされていた。まあ、ドワンゴ的にはそれでは興ざめなんだろうな…。


それでまあ、PVを観た人の期待に応えるために私は急遽予定を変更してAWSを借りて棋譜から学習をして強くしているという次第なのである。限られた時間内でやれることはすべてやったが、これで強くなってるかどうかは正直わからん…。

玄関口王玄関口王 2014/10/31 09:45 結局のところ、電王T版のやねうら王はレートいくつなんですかね?
後、羽生さんの対局は個人的には見てみたいです。

yaneuraoyaneurao 2014/10/31 09:59 ↑私にもレートがいくらかよくわかりません。200〜500局ぐらいさせないと勝率が判明しないのですが、その時間がないためです。ただ将棋倶楽部24に参戦していたとき(4コアPCでR3300前後)からは多少は上がっていると思います。仮に+100ぐらいとしましょう。あと今回はPCが8コアなので+200ぐらいあって、トータルではR3600相当だと思います。

しかし、これでも予選通過できるかどうか…。

お 2014/10/31 10:44 学習の件、ものすごく興味深いです。「学習をPC的力技ではなく、効率化できるか」という発想が魅力的です。とても汎用性の高い議論だと思いました。むちゃくちゃ基礎スペックの高い人(ミスしないとか思考が深い、早い)に将棋を覚えさせるのに100局でプロレベルというのなら夢があります(笑)人間にしてもそれなりの実戦経験や学習など考慮しなければならない変数があるわけで、その学習方はとても非効率ですものね・・・。あ・・・羽生さんのチェスも(ry

かず@なのはかず@なのは 2014/10/31 18:50 *1の内容と本文で1つずれているのでは?

ジャックジャック 2014/10/31 21:24 電王トーナメントの直前ってどんな気分なんですか?
山本さんはPonanzaが勝てるか心配で心臓割れそうらしいです。
やねうらさんも割れそうですか?

り 2014/11/01 07:54 > 何故depth = 2にするとそんなに強くなるのでしょうか。

将棋ソフトでdepth = 2で読むと、誤った評価値を出してしまう局面の割合が多いのでしょうね。
その価値が理解できない手はノイズにしかならないし、
ノイスが多いと学習効果も減るのでしょう。
depthが深すぎてもいまいちな理由は良くわかりませんが。

いよいよ電王戦ですね。頑張ってください!

Ta(ryTa(ry 2014/11/01 09:25 来年がその年と言ってしまった人を引っ張り出す訳ですね?

トラックバック - http://d.hatena.ne.jp/yaneurao/20141031

2014-10-26 ソシャゲーで上位ランカーになってみた結果

[] ソシャゲーで上位ランカーになってみた結果  ソシャゲーで上位ランカーになってみた結果を含むブックマーク  ソシャゲーで上位ランカーになってみた結果のブックマークコメント


今年の2月ごろの話なんだけど、ゲーム会社社長とこんな会話をした。


社長「やねさん、クラッシュ・オブ・クラン知ってる?」

やね「知らないっす。」

社長「クラッシュ・オブ・クランみたいなゲーム作りたいんだよねぇ。ちょっとやってみてよ。」


言われるままにクラッシュ・オブ・クラン(クラクラ)をインストールしたのだが、絵柄が生理的に受け付けなかった。そこで、クラクラのパクリゲーと言われる、『進撃の巨人』のほうをやることにした。『進撃の巨人』のほうは、劣化版のクラクラである。一応、今年の4月の時点で200万ダウンロード突破とかなんとかでTV CMをしていたので知っている人も多いだろう。


この手の課金型のソシャゲーは金を使えば、あとは時間さえあれば誰でも上位になれるわけで、今回、私はあえて無課金のままどこまでいけるかやっていたわけだが、先々月の時点で個人ランキング10位台。(特定されるとゲームがやりにくくなるので、現在順位秘密。)


f:id:yaneurao:20141026000255p:image


課金部門があれば間違いなく私が全プレイヤー中、1位だと思うんだけど、無課金だと課金組と5倍ぐらいスコアの伸びに差がある。プレイヤースキルカバーできるのは50%程度。あとはひたすら時間がかかる。デスクワークの合間、合間にポチポチ押している。平均すると1日10時間以上やっている。


上位の奴らは課金組でなおかつ1日14時間ぐらいやってやがる。よくもまあ、こんなゲームを1日14時間もやってやがるなと思うわけだが、読者からは「お前が言うな」とツッコミが入りそうであるな…。


ちなみに上位ランカー、月に10万円か20万円か使っていて、なおかつ時間をどっぷり使っているわけである。そのためか上位ランカー、会社社長が多い。会議中にもずっとポチポチやってやがるのだ。私も社内の会議中にもポチポチやっている。ちなみにうちの社員パズドラポチポチやっている。


私 「あの件はどうなってるかね?」(『進撃の巨人』をポチポチやりながら)

社員「あれでしたら、もう八割方完成してます」(『パズドラ』をポチポチやりながら)

私 「そうか…」(ポチポチ…)

社員はい…」(ポチポチ…)


まあ、読者のまわりにも会議中に社長ポチポチ同じゲームをずっとやってやがる会社があると思うが、そいつらが上位ランカーだ。

kanokekanoke 2014/10/26 13:22 クラクラのシステムは凄いっすなぁ…。運営イベントほぼ無しであの売上…(ポチポチ…)

ヒーローヒーロー 2014/10/26 16:11 やねうらおさんがだんだん載ってきたので、将棋を楽しみにしています。なじんだ人間将棋が静かに消えて行くのを、自分に投影して何とも言えない気持ちなっているようです。だけど少し斜に構えて、子供とも遊んでいます、ゲームにもはまっていますというポーズがとても愛らしい。

yaneuraoyaneurao 2014/10/26 16:12 twitterのほうで「上位ランカーになってみた結果」が書かれていないという指摘を頂戴しましたが、本文記事にあるように上位ランカーになった結果、上位の同盟に所属して、他の上位ランカーと交流が出来た結果、彼らがどういう職業でどういう生活をしているのかがわかり、社長や士業が多いという実態が把握できました、ということです。

yaneuraoyaneurao 2014/10/26 16:16 ↑*3 クラクラのシステム、かなりうまく計算されてますよね…。二番煎じが大量に作られるわけだわ。
↑*2 ご期待に添えるよう、頑張り…頑張ってくれよ、俺のプログラム!

猫田猫田 2014/10/28 12:07 うちの社長がこんなにもソシャゲーばかりやってるわけがない

トラックバック - http://d.hatena.ne.jp/yaneurao/20141026

2014-10-25 やねうら王開発実況用スレッド その2

[] やねうら王開発実況用スレッド その2  やねうら王開発実況用スレッド その2を含むブックマーク  やねうら王開発実況用スレッド その2のブックマークコメント


■ 2014/10/24 22:30 ETV特集棋士VS将棋ソフト 激闘5番勝負


明日NHKで、以下の前回の電王戦特集があります。以前、私が取材を受けたとき映像を再編集したものらしく、今回は1時間番組なので前回の『サキどり』のときより詳しく取り上げてもらえるようです。


番組概要

NHK Eテレ ETV特集棋士VS将棋ソフト 激闘5番勝負

放送日時:2014年10月25日23時

再放送2014年11月1日0時 ※10月31日深夜)

http://www.nhk.or.jp/etv21c/file/2014/1025.html


■ 2014/10/24 24:00 Bonanzaのmake_listの38要素化


Bonanzaのmake_listの38要素化について解説記事を書いたので興味のある人は御覧ください。


Bonanzaのmake_listの38要素化

http://d.hatena.ne.jp/LS3600/20141024


Bonanza方式評価関数 ≡ やね裏評価関数 ≡ make_listの38要素化 となる。(ここでの“≡”は、相互変換可能という意味)

以前、私はこれを数学的に証明した。Aperyの平岡さんが、先日ファジー学会誌にコンピュータ将棋について寄稿するときに「Bonanza方式評価関数 ≡ make_listの38要素化」について書いてくれた。


ここに俺様の大変エレガントな証明を書いて皆様に堪能していただきたいところだが、このブログの余白はそれを書くには狭すぎる。(とか言って逃げる)


■ 2014/10/25 17:00 人間コンピューター将棋との違い


よくプロ棋士の方は「将棋ソフトコンスタントに80点の指し手を出せる。だから強い。」みたいなことを言いますね。また、「人間は100点に近い手を指せるが、たまに0点の指し手を指してしまう。」と。


この意見には賛否あるようですが、勝率人間ソフトで等しい状況においては、正しいと私は考えます。そのことを以下で簡単に説明します。


人間は短手数の読みを見落とすことがありますプロでも3手詰めや5手詰めを見落とすことがあります。一方、将棋ソフトは0.1秒の思考時間でも7手詰め以下を見落とすことはないでしょう。


人間には短手数での見落としがあるにもかかわらず、ソフト勝率が等しいということは、長手数の読みや大局観において人間が短手数での見落としを補うだけの力が総合的見てあるということですね。(勝率が等しい状況においては、です。)


なので、勝率が互角ぐらいの人間ソフトが相対したときに冒頭のような発言人間から出てくるのは、これはまことに正しいのです。


ところが、最近は、ソフトのほうが勝ち越すということもあって、そうなってくると「長手数の読みや大局観」においても人間のほうが優れているのか何とも言えなくなってきます人間のほうがソフトより正確に形勢を判定できるかどうかは、その局面性質次第と言えるのかも知れません。(例 : 実際に先を読まないと形勢が判断できないような局面だと人間相対的に苦手である。)


■ 2014/10/26 16:00 これちゃんと動くんか?


いま棋譜から学習部を一から作ってます棋譜から学習部、あとは棋譜読み込みとPV(最善応手列)求めるところを書けばだいたい完成。たぶん今日の深夜ぐらいに完成。それできちんとパラメーターが収束するかどうかはワカラン…。


今日は私の誕生日なので誕生日祝い(?)に一発で動いて欲しいものだが…。


誕生日と言えば11月3日が息子の誕生日なので決勝で上位に入賞して息子の誕生日プレゼントを買ってやりたいのだが、いまのままでは上位に入賞どころか、予選を突破できるかどうかすら怪しい。というか、こんな状態で参加できるかどうかすら怪しい。



■ 2014/10/27 20:00 学習部の並列化


とりあえず棋譜から学習部は9割ぐらい出来た。AWSを借りようと思っていたが仮想32コアマシンが1時間4,5ドル程度。物理16コアでしかも2.8GHzなのでCorei7 4771 3台分ぐらいの価値しかない。


棋譜から学習部を並列化したほうがよろしい。並列化するためには別PCデータの送受信をする必要があるが、もっとお手軽にやるにはWindowsの共有フォルダ上で棋譜から学習の実行ファイルを動かせば良い。


1. (2PCで学習させるとして)棋譜を2つに分ける。

2. 実行ファイルネットワーク共有しているフォルダ上に置く

3. それぞれのPC棋譜から学習のための実行ファイルを起動する。

4. 片側はmaster、もう片側はslaveだとする。

5. イテレーションごとにslave側はKPP,KKPの値をどう動かすかという勾配値(derivative)をファイルに書き出す。master側はそのファイルを見つけたら丸読みして、その値を自分のderivativeに加算。

6. master側、イテレーション最後にKPP,KKPの値をファイルに書き出して、derivativeファイルを削除。

7. slave側、derivativeファイルが削除されていたら、(共有フォルダ上にあるmasterが書きだした)KPP,KKPファイルから読み込んで次のイテレーションへ。

8. master側も次のイテレーションへ。


これなら1時間もあれば実装できる。台数が増えたときもこのやり方を少し変えるだけで対応できる。


■ 2014/10/29 0:00 今日タイムリミット


とりあえず棋譜から学習部は書けた。学習に使う棋譜は64個でテスト中。


駒割りだけだと深さ3の探索において、棋譜との指し手一致率は26%。1回目のイテレーション後、深さ3の探索において指し手一致率32%に上がったので学習自体はうまく書けているようだ。(過学習するかとかちゃんと収束するかとかそのへんは知らん…)


Bonanzaでは指し手一致率は40%ぐらいになるので、最終的に数万棋譜に対してそれぐらいの一致率にならなければならない…が、時間がないな…。


あと、さっき走らせてたら、アクセス違反で落ちた。原因調べるのにデバッグモードで走らせないといけないが、デバッグモードだと100倍ぐらい遅いんだよ…。助けてくれー。


今日中に並列化までやってうまく学習が回せる状態になってなければ、もう駄目ですわ…。

せっかく面白くなってきたのになぁ…。


■ 2014/10/29 3:00 デバッグは終わった


並列化はまだだがデバッグは一応終わった。PC並列化は、もう少しの間、手作業で値をある程度のところまで収束させてからにしようかと思う。


それで私の対局棋譜からのみ(!)学習させてみた。棋譜の数は16局。ちなみに私の棋力は将棋ウォーズで3,4段。


学習に使った棋譜 = 16局。棋譜の内容 = 私 vs 私。

・depth = 3 , iteration = 16 , step = 4

Bonanzaではrootで1手進めてからdepth分読むのでdepth = 3だと4手読みの意味になるが、ここではrootから数えて3手の意味

学習に要した時間 15分ほど。


やねうら王側の棋力、いまの状態でたぶん初段〜3段ぐらい。ちゃんと王を囲ったりするので見ていて面白い。独創的な囲いをする。KPの左右対称で同じ点数をつけているためか、初手38金(たぶん78金と同じように思っているのだろう)とか指すことがある。


試しにBonanza6とやらせてみたら、形勢の評価がまるで違う。もちろん、Bonanza6のほうが正しい。しかし、面白いことに入玉だけは、このバージョンのやねうら王のほうが明らかに強い。Bonanza6が全く入玉しないのに対して、やねうら王はうまく入玉して、自玉の周りを固めながら駒得を果たして逆転してしまった。


f:id:yaneurao:20141029030530p:image

f:id:yaneurao:20141029030531p:image

f:id:yaneurao:20141029030532p:image


これは、次元を極限まで下げて学習させた成果だろう。入玉将棋のような未知の局面に対してもそれ相応の指し手が指せることが証明された。


わずか16局の棋譜(それも私の棋譜!)から学習したのに入玉将棋がきちんと指せるというのはなかなか凄い。これをもって、やねうら未来学習メソッド有効性が示せたと思う…が、いささか過学習ぎみになっている気もする。このへんの調整が当日までに出来るかどうかは正直わからん…。


■ 2014/10/29 7:00 AWS使うよ!


AWSで32コアマシンを借りたよ!計算資源としてはコスパ悪すぎると思うけど、1分、1秒が惜しいので仕方がない。AWSの料金回収メソッド(なんじゃそりゃ)が現地で炸裂するといいですなぁ…(´ω`)


f:id:yaneurao:20141029070222p:image


少ない棋譜から学習する能力はあるので、とりあえず相対KPPのほうがある程度収束するところまで棋譜の数は64ぐらいで回して、そこが収束してから指し手一致率を確認しながら棋譜の数を徐々に増やしていく作戦



■ 2014/10/29 19:40 AWS高いよ…


AWS借りたけど、iteration思ったほど回らないよ…。1回のiterationに結構時間がかかって、全然回せないよ…。回数まわさないと収束しないというのに…。


今晩並列化して、AWSを100台ほど借りれば2,3日で収束するのかも知れないが…。1時間400円だとして、


400円×24時間×100台×3日 = 288万円


かぁ…。電王トーナメントの1位の賞金超えてるんですけど…。


■ 2014/10/30 5:00 うわっ…私の次元、低すぎ…?


ここで残念なお知らせがあります


評価関数パラメーターの次元下げですが、どうも学習時間がかかりすぎることに気づきました。KPP、1つのパラメーターを128に分解していたのですが(NDFは4つに分解)、これだと学習におおよそ128倍の時間がかかります。探索している時間とかもあるので実際は128倍よりは小さな数字のはずですが、仮に50倍程度だとしても本来棋譜から学習にはハイエンドマシンで2週間程度はかかるので、50倍はやっぱり大きい数字です。


そこまで次元を下げると、人間のようにわずかな棋譜から学習できて、その人間っぽさに(指し筋のへたれさも含めて)ちょっと興奮していたのですが、いかんせん時間がかかりすぎます


そこで次元下げは128から16に変更します。これでも通常の16倍近くの時間がかかるのでどうなるかはわかりませんが…。とりあえず初期値を以前のやねうら王の評価関数の値から無理やり次元下げしたものを与えたので、0から回すよりは収束するのは早いかと思います


AWS(仮想CPU 32コア)

thread = 32 , depth = 3 , step = 32

・1回のiterationが7時間程度 → その後、高速化して6時間弱になりました。


ソフトの改良はこれにて終了。当日、余力があればブログに何か書きます

いまの状態だと決勝に残れるかどうかすら怪しいですが…。


■ 2014/10/30 14:00 並列化は辛いよ…


AWS10台ぐらい借りて並列化しようかといままさに考えているところですが(30万円ぐらいかかりますが…)、学習用の評価関数ファイルが大きくて、これをネットワークごしに送り合わないといけなくてPCを分けてもそんなに効率が出ない & 実装結構手間がかかる & ネットワーク転送量に対して料金が課せられるところでやりたくない、みたいな理由で今回は見送り


代わりに学習を少し高速化しました。20%ほど速くなりましたが…誤差です…。


今回は、棋譜から学習をいろいろやったので、こうやれば強くなるのかな、というのはわかってきました。評価関数の形だけ適切に設計すれば、あとはやねうら未来学習メソッド(この名前いい加減うざいな!)で自動的に強くなるので、ここまでくればあとは開発にそんなに時間を費やさなくとも(評価関数の形が適切であれば)強くなるのでしょう…。


そんなわけで適切な評価関数の形をコメント欄で大募集してます


■ 2014/10/30 16:20 やねうら未来学習メソッドの詳細


なんかtwitterで「このヒントでは全然わからん」という意見が多かったので、詳しいことを書いておく。隠すつもりはなくて、私としては「これだけ書けばわかるだろう」と勝手に思い込んでいたわけであるが。私が勝手に思い込んでいるだけなので、これがあのヒントでわかったから賢いとか、わからなかったから頭が悪いだとか、そういう類のものではない。(と思う)


ヒント)

・KPPを絶対と相対で128通りに分解

NDF手法(4通りに分解)を一般化


私は次のように考えて欲しかったし、また次のように考えてもらえると勝手に思い込んでいた。


3駒相対は3駒絶対から並行移動させて重なる関係にある。3駒絶対のほうの次元を下げると同じ要領で3駒相対のほうの次元を下げることが出来る。

NDF手法はKPPという三駒関係を4つに分解してあるが、PPを2駒と捉えるのではなく3駒の枠組みで捉えるならば、これはKPPのKが任意場所にあるものと捉えることが出来る。いま任意の筋、任意の段にあるKをK**と表記しよう。


つまり、NDF手法は、絶対KPP + 絶対K**PP + 相対KPP + 相対K**PPという4つに分解してあるわけだ。


一方、私がヒントとして書いた128と言えば2^7(2の7乗)である。KPPを分解するときに絶対と相対とで2倍になるから、絶対のほうが2^6通りあって、相対のほうも同じ数である2^6通りに分解できるということである。KPPという3駒を分解して2^6通りにするのだから、1駒2^2ずつ割当たる。NDFから連想で、言うまでもなくこれは段と筋である


つまり、いま絶対K78P76P67のような関係があるとして、絶対K7*P*6P6* と書けば、これは7筋目にいる王と6段目にいる歩と6筋にある歩による関係意味するとしよう。段と筋を表す場所が3駒で6箇所あるから、ここが * (ワイルドカード)になるか否かという2通り^ 6 × 2(絶対・相対) = 128通りなわけだ。


これにより、NDF手法がより一般化され、より細かく分解されることとなる。こうなっていることで少ない棋譜からそれなりに学習することが出来る(かも知れない)という理屈である


ただ、相対KPPに関しては結構難しい話があって、これはこの手法成功したらどこか向けの論文として書こうかと思う。


しかし、細かく分解されすぎていて、これに対して適切に学習させるのはボナメソのままでは結構難しい。ボナメソをいくつかの点で改良するか、あるいはボナメソより優れた学習メソッド必要だと思う。これについては、一応解決したつもりだが、まだよくわからない。きちんと解決できていたら、これもどこか向けの論文として書こうかと思う。

り 2014/10/25 15:36 ニコニコインフォに28秒のこの番組紹介動画がありました。
http://blog.nicovideo.jp/niconews/ni049292.html
やねうらおさんの「ナニコレ」も映像の中にあります。

yaneuraoyaneurao 2014/10/25 17:24 ↑おお、本当だ…。大舞台でああいうソフト側のミスで形勢がどかんと動くのは本当に珍しいですね。しかも、接戦に戻されるという。今後ソフトが強くなってくると二度と起こりえないハプニングかも知れません。そういう意味では歴史的かつドラマチックな出来事ですよね。

ジャックジャック 2014/10/25 20:20 え?何これ?クッソワロタwww
こんな事つぶやいてたのかw

り 2014/10/26 10:02 番組見ました。豊島将之七段の「COM将棋は終盤よりも中盤が強い」発言は不思議ですね。終盤では気が付いていない所で水平線効果が起きているのでしょうか?

Ta(ryTa(ry 2014/10/26 12:40 えっ 何これ
映像があるというのがw

YakitoriYakitori 2014/10/27 15:19 お誕生日おめでとうございます。益々の発展をお祈り申し上げます。
調子はいかがでしょうか。
送れるものは言葉しかありませんけど、たくさんのFUNをありがとうございます。
次の1年も実りあることを期待しています。

り 2014/10/28 20:48 誕生日おめでとうございます。一発で動きますように。ナムナム

茶田茶田 2014/10/29 00:57 「主役は遅れてやって来る」ってね・・・

もしもし 2014/10/29 01:29 トーナメントに間に合わなくても新やねうら王自体は完成させるんでしょ?

本田本田 2014/10/29 02:47 つデバッグが256倍早くなるテクニック

yaneuraoyaneurao 2014/10/29 03:22 ↑*1 デバッグはもう終わりました。他人のデバッグ速度と比較すると256倍速かった。(はず)
↑*2 楽しくなってきたのでいけるところまでやります!
↑*3,4,5 ありがとうございます。

YakitoriYakitori 2014/10/29 09:38 お、フラグ来ましたね。
何フラグかはあえて言いませんが、良い結果になるといいですね。

ジャックジャック 2014/10/29 12:47 誕生日おめでとう御座います。

茶田茶田 2014/10/29 20:08 「君の棋譜を学習させて君だけの最強の将棋ソフトを作ろう!」という売り文句で学習前のプログラムを売り出したら子供たちに大人気に!

ジャックジャック 2014/10/29 20:16 ゲーム開発ってお金かかるんですね。
Destinyってゲームが開発に500億円使って
初日売上だけで500億円回収したそうですよ。
電王トーナメントも賞金500億円ぐらいあればいいのになあ。

YakitoriYakitori 2014/10/29 22:45 趣味に大人の本気を見せるのが男の甲斐性。
やってくださいとは言えないけど、見てみたい気はする。
まぁ、赤字は1位取ってやねうら王の製品版出せば回収できますから。(震え声

kijibatokijibato 2014/10/30 03:14 発想が面白いですね。楽しくなってきたのは良いことだ。
確かかなり前にも出てたけど、学習をSETIみたいな
「おらに元気を分けてくれ・・・」的な
分散コンピューティングできると、こういう時、リーズナブルに
できそうだけど・・・仕組みを作るのと運用するのが大変か。
小回りの利いた妙案がないかなぁと考えてしまう。

ところてんところてん 2014/10/30 08:06 クラウドファンディング出来ませんか? 製品の開発的な建付で、一口五千円でβ版の提供みたいな。一日で1000万円集めて、学習を一日で終わらせて、あとは戦いまでのんびりして過ごすというプランはいかがでしょうか。私は5口位いかせて頂きます。

yaneuraoyaneurao 2014/10/30 08:18 ↑*1 面白いアイデアですね。今回のケースは、まだこれでマシンパワーを投入すれば収束するということが証明できていない & もっと改良の余地がありそうなので、なかなか前提条件的に厳しいですが…。
↑*2 分散コンピューティングでみんなから力をわけてもらうのは…考えてなくもないです…。
↑*3 お金をかければ強くなると100%わかっている状況でもないので…(´ω`)
↑*4 来年以降、電王トーナメントの賞金、もっと増えるといいんですが…。
↑*5 自分の棋譜からだけで学習させられる、自分と同じような棋風の将棋ソフト、今回の次元下げを使えば、本当に実現できそうです。(ただしそんなに強くはないんですが…)
↑*6 ありがとうございます。
↑*7 死亡フラグです><

ジャックジャック 2014/10/30 09:30 やねうら王2014(5月時点でのやねうら王)で出場するのは
どうでしょう?
今開発してるバージョンで予選敗退しても「コンピューター将棋の
歴史には意味があった」って証明にしかならないですよ。
弱いバージョンでわざと負けた事になります。

Aperyの平岡さんは
一般の人にPRする際に、内部の実装がどうだというのを前面に押し出したPRはあんまりだと思うので、将棋ソフトのPRも何が出来るかを書いていきたい訳だが、Aperyはただの思考エンジンで付加機能も無くて、考えてもツラミが発生するので適当に内部の事書いてお茶を濁すパターンにしよう。

選手権のアピール文書は他の開発者に向けたアピールな感じで書くと思えば良いのか。電王トーナメントもそう思えば良いのかな。。

電王戦出場ソフトはトーナメントから1ヶ月間のチューニング期間があるが、その間には普通に強くする変更については何も書かれてないからまぁOKなんだろうと解釈した。たとえ評価関数や探索部の総入れ替えであろうとも。

と言ってる事ですし
やねうら王のアピール文あれは嘘だ。
って開き直りましょうww

YOSIYOSI 2014/10/30 13:00 ↑今年の電王戦に勝つことはどうでもいいことだと思いますよ。もっと未来を見ているわけで、そうでないと開発意欲もわかないのではないかと。

ジャックジャック 2014/10/30 14:01 ↑未来見てるのかなあ?
未来って名前つけた、只の縛りプレイのような気がしてならないのだが。
開発意欲がわかないから縛って開発を楽しもうとかじゃないのかなあ。

やねうら(未来)定跡
やねうら王は人間が考えだしたいかなる定跡も搭載しない。
やねうら(未来)学習メソッド
やねうら王は人間が生み出したいかなる棋譜も参考にしない。
やねうら(未来)探索メソッド
やねうら王は従来のいかなる将棋ソフトの流れも汲まない。

これ相当ハンデですよ。

furyfury 2014/10/30 14:21 今回の「やねうら王」は「やねうら王2014」をベースにしているため、
多かれ少なかれ前回よりは強くなっているとの認識なのですが間違っています?

yaneuraoyaneurao 2014/10/30 15:53 ↑*1 前回のやねうら王(Bonanza6より少し強い程度)には8割以上勝ち越しますが、その程度では予選通過できるかどうか…。
↑*2 そういう縛りを入れることによって新たなアイデアが浮かんでくる(こともある)のです!
↑*3 ありがとうございます。
↑*4 やねうら王2014(5月時点のやねうら王)からやねうら未来学習メソッドによってR200ぐらい上が…るといいですなぁ…(´ω`)

かにかに 2014/10/30 15:58 えびふらいのクジラちゃんやBOINCのように分散コンピューティングでイケるのでは?
と思い浮かびましたが、冷静に考えると安定性の面などでダメそうですかね

yaneuraoyaneurao 2014/10/30 16:30 ↑いやー、PV(最善応手列)を求めるところなど部分的にはいけると思います…が、最近の傾向として評価関数が大きくして、メモリを馬鹿食いするので最低でも16GB、評価関数の形によっては64GBぐらいないとまずくて、なかなかその条件を満たすのも大変ですなぁ…(´ω`)

にゃにゃ 2014/10/31 01:15 ワクワクしながら見てます
開発途上を実況してくれるのもエンターテイメントになりますわ、本人は大変でしょうが…
論文に書ける題材が見えて来るなどは正直羨ましいです、研究やってた身としては本当に楽しそうに見える。
応援しています。

YakitoriYakitori 2014/10/31 02:15 あら、言っちゃった。シんじゃダメです。勝ちましょう。
その死亡フラグを折って栄冠を!

り 2014/11/01 08:11 > そんなわけで適切な評価関数の形をコメント欄で大募集してます。

段、筋のワイルドカードみたいな話がありますが、「駒種類ワイルドカード」もいいような気がします。
つまり玉の右隣に何かしらの自分の駒があると「自分の持ち駒はそこに打てない」「相手の持ち駒もそこには打てない」「自分の駒はそこには移動できない」という部分は共通した価値であるとし、その共通項をまとめる意味というかなんちゅうか本中華

トラックバック - http://d.hatena.ne.jp/yaneurao/20141025

2014-10-15 やねうら王開発実況用スレッド

[] やねうら王開発実況用スレッド  やねうら王開発実況用スレッドを含むブックマーク  やねうら王開発実況用スレッドのブックマークコメント


■ 2014/10/15 9:00 Stockfishの最新版は罠なのか


5日ほど前にStockfishの最新版(GitHubのもの)を参考に探索部分を調整した。Stockfishの前回から差分調べたり、デバッグしたりするのに丸2日ぐらいかかって、そのあと2日ほどかけて200戦ほど対戦させると古いバージョンに対して1割ほど負け越していた。なんなんだろう。最新版は罠なのか?もっと対戦させるべきなんだろうけど、やっている戦型が偏っているせいもあってか正確な比較になっていない気もするし、とりあえず負け越しは気分が悪いので涙目でrollback。


■ 2014/10/15 19:30 やねうら未来探索について


コメント欄より。

> 「将棋ソフトの流れを汲まない」ってところについてもう少し詳しく書いてくれると嬉しいです。


(自分以外の)日本人が考え出した将棋ソフトアイデア実装を一切使わないという意味です。具体的にはBonanzaの1手詰め、3手詰め、GPS将棋のdf-pn、Bonanza方式の手駒だけ損している局面の検出、BonanzaメソッドBonanza型の3駒関係etc…。(時間の都合で1手詰めと3駒関係はもしかしたら使うかも知れませんが…)


別に私は日本人に恨みがあるわけではありません。彼らが生み出したものがどれくらいのものなのか。コンピューター将棋歴史(成果)がどれほどのものなのか。それらを正しく評価するためには彼らの成果をいったん全否定して、そしてそれなしに独力でやってみて、そのあと、出来がよくなかったら、「やっぱり1手詰め入れたほうがいいよね。1手詰め偉大だよね。」というように必要性や偉大性が初めて実感できると考えていますニーチェ言葉で言えば、これが「およそ到達しうる最高の肯定の形式」でしょう。


■ 2014/10/15 21:15 やねうら王はツンデレちゃん


> PVではキオビヤドクガエルみたいなロボットですが、あれは作者からするとやねうら王のイメージとは違うのですか?


誰がキオビヤドクガエルだよ、ウワァァァンヽ(`Д´)ノ

やねうら王のイメージガールは、やねうら王公式*1ツンデレちゃんです。


■ 2014/10/15 21:20 第2回 将棋電王トーナメントPVの件


私の「カップラーメンのお湯を原爆で沸かす人はいない」というくだりは、人間の知性を超越した汎用的な思考エンジンにもなりうるようなコンピューター将棋/チェスの探索エンジンを、たか将棋ソフトのためだけに使うのは暴挙であり、コンピューター将棋しか使わないとしたらそれはエンジニアとしての傲慢であり怠惰であり社会的損失である、という意味です。


また「コンピューター将棋歴史ナンボのもんじゃい」というのは、上で書いた「彼らの成果をいったん全否定して、そしてそれなしに独力でやってみて、(そうして初めて)その必要性や偉大性が初めて実感できる」という流れでしゃべりました。


私の発言の前後大会を盛り上げる趣旨にそぐわないと判断されたのか例によってカットされており、意味不明映像になっておりますが…。(´ω`)


まあ、私のサゲサゲな発言をうまく切り貼りしてアゲアゲな感じにする佐藤映像さんの手腕はさすがと言わざるを得ません。(皮肉ではなく、サゲサゲな感じでPVに使われるよりは、アゲアゲな感じで使われたほうが良いという意味です。)


■ 2014/10/16 9:00 やねうら未来学習メソッドについて その1


コンピューター将棋では、ボナンザメソッドを初めとして棋譜から評価関数パラメーターを機械学習させるのが主流であるが、初代Bonanzaでで3万棋譜、後発の強豪ソフトはその何倍もの棋譜を用いている。果たして本当にそんなに要るのだろうか。人間将棋を覚えてプロ棋士になるまでに10万棋譜も(他人の棋譜を)並べるだろうか?下手すると1万棋譜にすら及ばないのではなかろうか。それなのに人間はちゃんと学習できるわけである。そこに人間の偉大さがあるわけだが、裏をかえせばとりわけコンピューター将棋の評価関数パラメーターの調整方法には改良の余地が大いにあるわけだ。


例えば、NDFは3駒関係を3駒絶対+3駒相対+2駒絶対+2駒相対のように分解して学習させた。*2 データ次元を下げたわけだ。NDFはNDF独自の学習メソッドを開発したが、その効果のほどは私にはよくわからない。というのも、このように3駒関係を分解してボナンザメソッド学習させるだけで相当に棋力が向上すると言われている。たぶんAWAKEはこの方法*3からボナンザメソッドボナンザメソッドで改良の余地があるだろうけど、データ次元を下げることでボナンザメソッドのままでももう少し精度の良い学習が出来る。


また別の言い方をすれば、ボナンザメソッドほど優秀な学習方法でなくとも次元をひたすら下げていけばちゃんと学習できる(かも知れない)ということでもある。そうすれば大量の棋譜は要らなくなる。学習時間が短縮化できる。羽生さんの棋譜だけで学習するだとか、長い持ち時間自己対戦させたコンピューター将棋同士の対局棋譜のみを使う、というようなことも出来るようになる。(かも知れない)


■ 2014/10/16 18:00 やねうら王(笑)


今回、電王トーナメントエントリーするとき名前をどうしようかと思ったのだが、「やねうら王 2014」だと、今年5月ごろに将棋倶楽部24に放流していたものと紛らわしい。かと言って、「やねうら王 2015」だと来年はどうするのかという問題が出てくる。


「やねうら王 2014 後編」「やねうら王 2014 Alternative」などいろんな名前を考えた結果、「やねうら王(笑)」とかにしたらどうかというアイデアが浮かんだ。ちょうど『STEINS;GATE』に夢中になっていたときで、作品中に出てくる「電話レンジ(仮)」からの着想である


しかし「やねうら王(笑)」にしてしまったら、ニュースサイト新聞で取り上げられたときに「Aperyとやねうら王(笑)は、激闘を繰り広げた。」とか書かれても、全然激闘に見えないって言うね。個人的にはそれはそれでやねうら王らしいかなと思うんだけど、なんか記者の人が迷惑しそうなのでストレートに「やねうら王」のままで行くことにした。


■ 2014/10/17 9:00 やねうら未来学習メソッドについて その2


次元の下げ方は他にもある。例えば、王の右隣の金と二つ右隣の金とではどちらが価値が高いだろうか?右隣のほうがいくらか価値が高いだろう。このように2駒相対でも、隣接する升につく値自体比較的滑らかであると考えられる。これを利用する。Aperyチームはたぶんここを多項式近似でやっている。*4 2変数関数多項式近似、テイラー展開してほげほげ…うーんそんなの20年ぐらい前にやったなぁ…(遠い目)


時間もないことだし、一発でバグなしで書く自信がないので多項式近似は私は採用見送り。もう少しシンプル方法でやる。まあ、多項式近似が適しているのかどうかはよくわからない。そのへんは(3駒関係採用するとして)3駒関係にどういう点数がつくのが適切かという問題でもある。


また例えば、先手の王と角と銀のような3駒関係を考えるとき、角の利きがあるところとないところとでは事情が違ってくる。角が行ける場所(チェッカープレート的な意味で)の銀かどうかでも話が変わってくる。また敵陣にいる生角と、非敵陣にいる生角とでも価値は大きく違ってくる。


何らかの関数で近似するにしてもこれらについては分けて考える必要があると思う。(不連続関数になるだろうから) このへん比較実験等をやるべきなのであるが、実装機械学習ランニング(自己対戦)というサイクル、残り2サイクル回せるか回せないかの時間しかない。バグなしで一発で書けて2サイクル回せる程度。たぶんそれは無理。1サイクルしか回せない。つまりワンチャンしかない。泣きそう。


ともかく今日中にやねうら未来学習メソッド(うざいな、この名前!)の学習部を完成させてランニングするぞー。


■ 2014/10/18 11:00 OS X Yosemiteはヨウスミテ


OS X Yosemite無料配布が始まったので速攻インスコした。VMWare Fusion4が使えなくなった。Fusionの最新版は7らしく、7ならYosemite対応しているらしいのだが、OSが無料なのにOSのアップグレードごとにFusionにお金を払うのは馬鹿らしい。もしかすると仮想環境はもうオワコンなのかな…と思いつつ、Fusion4→7はアップグレード扱いにならず新規購入のみだったので、Paralles Desktop 10を購入。


ParallesではFusionのディスクイメージをそのまま使えるのだが、ディスクイメージの変換をしないといけなくて、MacBook Airにその空き容量がないから外付けHDDにいったん移動させて…みたいなことをやってたら丸一日潰れた。こんなんで電王トーナメントに出れるのか見ていて不安になっている読者もおられるだろうが、もちろん私も大いに不安である


■ 2014/10/19 17:00 妖怪将棋はじめました


土日は息子(5歳)と遊ぶ曜日と決まっているので、息子と遊び倒した。プログラム1行も書いてない…ヤバイ。息子は本将棋になかなか興味を持ってくれないので、毎回将棋の駒を使った新しいゲームを私が考えて、それをやることにしている。今日やった(私がルールを考えた)のは「妖怪将棋


妖怪将棋ルール】 59と51に先手、後手の王を置く。先手と後手が交互に「歩」をサイコロ代わりに振る。表が出ると移動であり、盤上の好きな駒を本将棋ルールに従い移動できる。(手駒があればそれを打つことも出来る) 裏が出ると「召喚」か「移動」かを選択できる。召喚したいときは、「召喚〜!」(妖怪ウオッチの妖怪召喚するときの声で)と言いながら駒箱から好きな駒を1枚召喚できる。召喚した駒は好きな場所に置ける or 自分の手駒化することができる。王を取られると負け。


なかなか面白いと思うのでみんなやってみて。駒を並べる手間が掛からないし、将棋の終盤の醍醐味が楽しめる。


この妖怪将棋ルール140文字にまとめて、ツイートしてきた。流行るといいな.. → https://twitter.com/yaneuraoh/status/523752757883174912


※ 追記 : 難度調整の例)

変更ルール1) 玉の位置が59と51からだといきなり頭上に金を召喚されてしまって短手数で終了してしまうので子供がそれを学習したら、玉の位置を58と52、57と53のように場所を変えてやるとゲーム性が増します。

変更ルール2) あるいは、初期陣形として玉の両側に金を配置してやるだとか。

変更ルール3) 歩を47,57,67(後手は43,53,63)に配置するだとか。

変更ルール4) 折りたためる将棋盤なら盤面を片側(4×9)だけにするだとか。

変更ルール5) 召喚は歩を振って可能にするのではなく、1局に10回まで自分のターンで「召喚」と宣言すると召喚できるようにすると実力勝負に。

変更ルール6) 歩を振る枚数を2枚にして、1枚裏 = 召喚 or 移動。2枚とも裏 = 変身 or 喚 or 移動。として、変身は自分の盤上の駒を駒箱の別の駒と交換できるだとか。

変更ルール7) 歩を振って低い確率において、「変身」以外に「チェンジ」と宣言して盤上の任意の2駒(相手の駒でも良い)を交換できるだとか。

変更ルール8) 歩を振って低い確率において、「変身」以外に「反転」と宣言して盤面を180度回転させられるだとか。


のようにやるごとに新しいルールを追加したり減らしたりして、そのルールにおける最善を息子に考えさせたり、そのルールルールとしての良し悪しを考えさせたりしている。自分の思考訓練にもなってとても楽しい


■ 2014/10/19 20:00 やねうら未来学習メソッド3


普通棋譜に出現回数が少ない因子はゼロ収束する。(というか、0に収束するような力を学習時に加えてやる)


そうすると、学習時に出現していない局面の因子はゼロ収束してしまう。そこで、棋譜の数を桁違いに増やしていろんな特徴因子が必ずたくさん出現するようにする。しかしそんなに大量の棋譜は世の中にはないので(プロ棋譜が3〜5万と、floodgateの棋譜が50〜100万棋譜程度)、NDFがやったように何らかの方法局面を水増ししないといけない。大量の局面があるので学習にも大量の時間を要する。(局面数に比例した時間を要する)


棋譜局面数を増やすというのは力技ではあるが、確実に成功する方法である。何故なら、それによって正しい(いい感じの?)値に収束しやすくなるからである。これには電気代と学習に要する時間必要である。(さらに言えば数億〜数百億局面を与えて正しくパラメーターが収束するような学習メソッドでなければならないが…。)


もう一つ別の方法は、少し手間がかかる方法ではあるが、出現しなかった特徴因子がゼロ収束してもそれほど問題とならないように学習時の評価関数設計を行なうことである。そうすると棋譜が少なくて済む。学習に要する時間も劇的に短縮される。


どうやって設計するか例示しよう。


例えば、玉の周辺8近傍の空き升の状態(空いている/いないを1bitで表現するとしたら8近傍=8bit=256通り)と玉の位置(81升)との組み合わせとなる。大雑把には256×81通りの組み合わせとなる。これに対する広さのボーナスを評価因子として用意するときのことを考えてみよう。


玉が中段にいて8近傍がすべて駒に囲まれているような局面現実的には出現しない。かと言って、そのときこの評価因子が0になってはまずい。


そこで、例えば、

玉の左上・真上・右上に駒があるときの広さボーナス = 玉の左上・真上に駒があるときの広さボーナス + 玉の左上・右上に駒があるときの広さボーナス + 玉の真上・右上に駒があるときの広さボーナス + 玉の左上・真上・右上に駒があるときの広さボーナス

というように分解してやる。そうすると、最後の項が出現回数ゼロで、ゼロ収束したとしてもそこそこ正しい値がつく。


このような因子の分解を玉の位置に関しても行なう。


88の玉の真上に駒があるときボーナス = 8段目に玉がいて、その真上に駒があるときボーナス + 8筋目に玉がいてその真上に駒がいるときボーナス + 88の玉の真上に駒があるときボーナス


ここでは段と筋に対して分解したが、分解の仕方はいろいろな方法が考えられる。なるべく合理性のある分解の仕方が好ましい。穴熊かそうでないかで分けるだけとか、入玉かそうでないかで分けるだとかも考えられる。


88の玉の真上に駒があるときボーナス = 8段目に玉がいて、その真上に駒があるときボーナス + 8筋目に玉がいてその真上に駒がいるときボーナス穴熊ではなくて、玉の真上に駒があるときボーナス入玉ではなくて玉の真上に駒があるときボーナス + その88の玉の真上に駒があるときボーナス


以下略


とりあえず今回出場するやねうら王はこの方法学習させてみる。

因子の分解の方法をまだ考え中なんだが、もう二週間切ってるのにそんなことを言っていて大丈夫か…。


■ 2014/10/20 22:45 MagicBitboardはオワコン


コンピューター将棋では飛・角・香のような遠方駒がどこまで利いているのかを得るため、コンピューターチェス技法であるMagicBitboard*5を使っている人がいますPonanzaやAperyなどがそうです。*6


しかし、将棋ではMagicBitboardはテーブルサイズが大きくなるのでCPU cache汚染がひどく、速度的なメリットは得られていないというのが私の考えで、やねうら王ではMagicBitboardは使っていません。MagicBitboardを使わない場合でも、簡単な比較実験において速度的にはほぼ同等だとわかっています


それでも、MagicBitboardを使わないと、StockfishのようなMagicBitboardを使うタイプの探索部を参考にしようと思ったときに、そのソースコード等価にするために苦労するというのはあります。そこで、MagicBitboard自体は使いたくはないが、MagicBitboardのようなことをしたい、例えば玉の8近傍に駒があるかないかを調べるために、occupied bitboardから、王の8近傍に駒があるかどうか直列化して集めてきたいということはあります


このような将棋ソフト開発者の声がインテルに届いたのか(?)、HaswellではBMIというビット操作を行なう命令が追加されており、これを使うとMagicBitboardと等価なことが簡単に出来ます

http://d.hatena.ne.jp/LS3600/20141011


簡単にとは言っても、速度的に数%速くなるかどうかだけの話なので、こんな直前に大改造してバグっていたら大変なので私は今回は採用しませんが、BMIはなかなか夢のある命令セットではあります


■ 2014/10/20 22:50 やね裏評価関数とは何か?


電王トーナメントアピール文書、「やる予定」「やる予定だけど効果かどうかはわからん」みたいな書き方をしているものもたくさんありますが、ソフトアピール文通りになっていないからと言って罰則があるわけではないのでそれを見越してやねうら王は適当ぶっこいてるんだろうと邪推している人もおられるかも知れません。


今年はどうなるかはわかりませんが、しかし、去年は私は書いている通りのことはすべてやりました。そのなかでやね裏評価関数についてだけは、説明を書いてなかったのでそろそろオープンにしてもいいかと思い、解説記事を書きました。興味のある方はご覧ください。


やね裏評価関数とは何か?

http://d.hatena.ne.jp/LS3600/20141020#p1


■ 2014/10/21 9:30 棋譜から学習部を書き起こし中


特徴因子の次元下げがやっと綺麗に定式化できた。NDFがやっている次元下げよりもっと一般的で、もっと(数式的に)綺麗な形で定式化できた。これだと10倍ぐらい収束が早い(当社比)ような気はする。


あとは、棋譜から学習部を1から書き起こし中である。(いまごろ…) やっと1/4ぐらい書けた。あと3,4日で書いて、AWS(Amazon Web Services)借りて棋譜から学習やる。高くつくなぁ…。


学習部はソース行数にして5000行程度になる感じ。これ一箇所でもバグってるとうまく収束しないという…背筋が寒くなるな。


■ 2014/10/21 18:30 NDFの近似的並進対称性


NDFの「相対位置を保ったまま3駒を移動してもそれほど価値が変わらない」(AperyのPR文より)というのは、AWAKEがやって、評価部でR250上がったかのように書いてある。(これだけで上がるのかそうでないのかはこのPR文からはよくわからないが…)


上位の将棋ソフトを作っている開発者は、未知の局面(棋譜から学習ときに出現しなかった特徴因子がたくさん出てくる局面)に対する適応力を上げるためにこういう小細工をいろいろやっているわけだが、数百万局面しかないのに数億の評価関数パラメーターを求めようというのが土台無理な話であって(連立方程式を解くときに未知変数が多すぎる場合に似ている)、そもそも1兆ぐらいの棋譜があれば、ほとんどの特徴因子を網羅できるはずであり、NDFの手法暫定的につけてある値よりは遥かに合理性のある値になるはずである


まり

棋譜が足りなくて出現しない評価因子がゼロになってしまう(Bonanza 6.0状態) <<< NDFの手法(+R250) < 多項式近似など <<<(超えられない壁)<<< 超大量の棋譜から学習

みたいな関係式は成り立つのかなと思う。


あとはNDFがやっているように手番を評価関数に追加するとR50〜100ぐらい上がるのかも知れないけど、私は実験していないのでわからない。


■ 2014/10/22 8:30 番組の途中ですが科研費時間です


なんか知り合いの大学先生に誘われて経済学のなんかを共同研究することになっているのだが、科研費を申請の締め切りが迫っているのだよ。


GPS将棋を初めとして、大学関係者はこの時期大変忙しいので電王トーナメントに出場するのは結構厳しいような気がする。特に

科研費 >>> (超えられない壁) >>> 電王トーナメントの優勝賞金

であるようなところにとっては…。


■ 2014/10/22 19:30 やねうら王の開発の進捗


棋譜から学習部、1/4ほどさらに書いた。あと半分ぐらいで完成。実装上のミスがなければ、そこそこ棋力が上がる気はするんだが、気がするだけかも知れん…。AWAKEの評価部でBonanza6から+R250は信じていいのか、否か。時間もないしR150も上がれば御の字であるが。


■ 2014/10/22 20:00 今年のApery・Ponanzaの強さについて


Aperyが今年5月の選手権(世界コンピュータ将棋選手権)のときバージョンに7割ぐらい勝ち越すらしいのだが*7、+R150ぐらいか。Aperyは5月の選手権の時点でBonanza6の評価関数よりは(評価部において)+R100ぐらい上だったと思うので、Bonanza6を基準に言うと+R250で、AWAKEの+R250とだいたい計算は合う気はする。


Aperyの選手権バージョンとやねうら王2014(5月時点でのやねうら王)はほぼ同じ強さ。やねうら王がいまから+R150になると、Aperyが選手権バージョンから+R150なら、Aperyと同等。


去年の電王トーナメント時のPonanza(=今年発売されたPonaX)は、やねうら王2014に7割ぐらい勝っていたので+R150。

今年のPonanzaは去年のPonanzaから7割ぐらい勝つらしい。*8


まり、去年から+R150。ということはやねうら王2014からは+R300。やねうら王がやねうら王2014から+R150上がってもまだ今年のPonanzaにはR150も届かない。(そもそも、やねうら王がこのあとR150も上がるかどうかわからん…)


やねうら王2014は5万円の自作パソコン将棋倶楽部にてR3300程度であったが、今年のPonanzaはここに+R300。そして最新のパソコンで(16コアXeonで)やるとたぶん+R400ぐらい上がって、R4000。将棋倶楽部24でR4000とかバケモンっすな…。もはや羽生さんを連れて来ても2,3割勝てるかどうかすら怪しい。将棋ソフト、この1年で強くなりすぎだろ!ソフトの改良により年間R50ぐらいの上昇と言われてたのは何だったんだよ!ヽ(`Д´)ノ


※ 追記 : 上記のPonanzaの件、間違っているのではないかとコメント欄で指摘もらいました → http://d.hatena.ne.jp/yaneurao/20141015#c1413986160

勝率70%はいってくれよ・・」*9とのことなのでまだ前回出場時のものに対して勝率70%には行ってないけど、行きそうな雰囲気ではあります…。


■ 2014/10/23 25:00 やねうら未来学習メソッド -- 次元下げその後


相対KPPの次元下げは一般化するのがかなり難しく、今日試行錯誤しているうちに、3つの定理発見した。最初、その難しさについて私は理解できていなかったのだが、いまならハッキリ言える。相対KPPの次元下げ、これは難しい。


いまこの定理を解説している時間はないし、そもそもこのような次元の下げ方が妥当かどうかも疑わしいので詳しい話は割愛する。とりあえず私が検算した結果だけ写真で掲載しておく。この写真だけで意味のわかる人にはわかるようになっている。


f:id:yaneurao:20141024010145j:image


■ 2014/10/24 20:30 鏡像問題


KPP絶対でもミラー(左右対称)は考慮されなければならない。これはこれで難しいのだが、いま、問題をすごく簡単化してPP絶対についてのみ書くのでプログラマーの人や数学の得意な人は挑戦してみて欲しい。


問題1)

いま、駒P1,P2があるとして、この盤上の升 P1 = (x1,y1) , P2 = (x2,y2)を考える。

盤上の升なのでx1,y1,x2,y2は筋・段を表す1から9までの整数とする。


任意のP1,P2に対して、P1とP2の組が(5筋を対称軸とする)鏡像関係にあるときは同じidを返す関数必要である。この関数設計しなさい。


例)

「31金と72金」の2駒が存在する盤面と、「32金と71金」の2駒が存在する盤面とは鏡像関係にあります。(x1,y1,x2,y2) = (3,1,7,2) と(3,2,7,1)が同じidを返さなければなりません。

※ 注 P1 = P2のケースをアリとするかナシとするか、どちらの方法もそれなりに合理性があるが、ここではBonanza6に倣い、P1 = P2のケースもありうるものとする。


ただし、

1) P1,P2は「金」と「金」のように同じ駒種であると仮定して良い。

2) 得られるidは0からまり整数として連続していること。(欠番があると配列を確保するときに勿体無いため。)

3) 変換のためにid[x1][y1][x2][y2]のような表引きはしてはならない。(メモリが勿体無いため)

4) 小さな計算量で求まること。長い時間のかかるループをぶん回すの禁止。(ここの処理に時間がかかるの嫌なため)


問題2)

問題1)の関数の逆変換も作ること。問題1)の関数で得られたidから、元のP1,P2の升(2通り)が得られること。


問題3)

P1 = (kind1 , x1 , y1) , P2 = (kind2 , x2 , y2) , kindは駒種(0から19までの整数)であるとしたとき問題1),問題2)と同じようにidを求める関数とその逆関数設計しなさい。ただし、すべての駒種の駒は、すべての升に置けるものとする。



まあ、上のように書くと難しそうに見えるが、「鏡像関係のものを除くと、P1,P2の組み合わせは何通りあるか」という数え上げの問題帰着する。これなら大学入試数学レベルだ。(15分で解けとか言われると涙でそうだが…)

YakitoriYakitori 2014/10/15 09:31 開発期待してます。
HSっていうゲームのボット戦の経験を言えば、
カードゲームなのに全体攻撃をほとんどの場合備えていてそれを撃って相手を劣性に追い込めばボットの勝ちなんです。
逆に言えば全体攻撃を封じさえすれば劣化PCなんですね。
カードゲームの特性でそれでもカードが来なくて負けますけど、対策しないよりはましです。
その経験を踏まえて、頭の中に万能な方法が3個くらい浮かんだらそれを捨ててください。
人間頑張れば10個くらいのベストメソッドを封じれるので対策が完全であるワーストケースを見るべきです。
ベストメソッドは運ですがワーストケースは自力です。
自力をふやしてくだしあ。

梨 2014/10/15 10:01 大変だと思いますが、開発ガンバです〜

 2014/10/15 10:06 コーディングには着手してないとはいえ、
やねうら未来〜〜でちゃんと戦えるようになる着想はあるということで、良いんでしょうか?

チャモアンチャモアン 2014/10/15 10:28 私も楽しみにしています。

第二回のボンクラーズは、ボナンザを複数台のPCで動かしてパフォーマンスが出るように改良した。予算さえあればPCの数を増やしてもっと強くなる。名人にも勝てる。という理解でした。

クラスタ化?というのも大変なのかもしれません。ですが、感覚的に凄く反感がありました。素人目では、同性能のハードでボナンザよりずっと強くなるように努力しました! というのが正しい開発なんじゃないかと。台数を増やせば強くなるというなら、もう開発なんて止めてしまえです。インテルさん任せで。

それとは対照的で、驚きでした。
前の記事で、3つの宣言をみて痺れました。本当にできるの?と不安になる内容ですが、浪漫への挑戦感が半端ない。

PV:またヒール役に編集されていますが、前回とは違い大丈夫と思います。将棋ファンは、プロ棋士への敬意については厳しいです。でも、藤井システムばりの異端の挑戦には応援したくなる人が多いと思う。

強敵:シュタゲじゃ仕方ない、許します。

odakinodakin 2014/10/15 10:46 応援してます!

はっほーはっほー 2014/10/15 17:11 やねうら未来探索メソッド的には、Stockfishの使用はおkなんですかね…? まあ、将棋ソフトではなくチェスソフトですが

はっほーはっほー 2014/10/15 17:31 「将棋ソフトの流れを汲まない」ってところについてもう少し詳しく書いてくれると嬉しいです。いくらなんでも、基本的なアルファベータ探索などの技術は取り入れるとは思いますし。
連投失礼しました。電王トーナメント応援しています!

茶田茶田 2014/10/15 19:02 一つ前の記事を読んで、「ははぁ〜ん、やねさんは16日までに手書き部分を終わらせて後はゲームやってる間に自動学習させるつもりだな?」と深読みしてたのですが、難航してるっぽいですね…

ジャックジャック 2014/10/15 20:07 やねうら王って、やねうら王の公式サイトでツンデレなセリフを喋ってるピンク色の髪の女の子をイメージしたらいいんですか?
PVではキオビヤドクガエルみたいなロボットですが、あれは
作者からするとやねうら王のイメージとは違うのですか?

p-01dp-01d 2014/10/15 22:25 GPSfishのstockfishのバージョン上げることにチャンレンジした方がおられて、やはり強くならない弱くなることに悩んでおられましたね 2.1から段階的にあげておられましたが2.2にする時点ですでになにかおかしいみたいです

yaneuraoyaneurao 2014/10/15 22:40 ↑うわー。そうなのですか…。以前からの差分を確認したところ、枝刈りのパラメーターとか若干変更になってたり、ONE_PLYが1になって半手延長みたいなことが出来なくなってたりして、そのへんが将棋にそぐわないのかも知れないなーとは思っているのですが、結構、根が深そうです。

p-01dp-01d 2014/10/15 22:52 ここに貼るのもなんですが、blogをやられておられます しかしGPSfishはstockfish2.1への将棋へのチューニングってどれくらいされているんでしょうね?

yaneuraoyaneurao 2014/10/16 00:03 ↑GPSfishは、探索部の将棋向けのチューニングはほとんどしてないと思いますよ。チューニングの余地がそんなにないというのもありますが、いざチューニングしようと思っても、1つのパラメーターをチューニングするために自己対戦を何百局もやって勝率を見ないといけないのに、実際はパラメーターは組み合わせなので数個のパラメーターの調整のためにトータルでは何万局も自己対戦しないといけなくて…せっかくチューニングしてもStockfishのバージョンが上がったらまたチューニングやりなおしですし…。なかなか大変です。

DE3SDE3S 2014/10/17 15:07 時間もあまりなさそうですが頑張ってください!応援しております。

ごくうごくう 2014/10/17 19:20 オラすっげえ不安になってきたぞ!

り 2014/10/19 07:49 PV見ました。ドワンドはThink differentみたいな演出を狙っているようにも見えましたが、Think differentの雰囲気にはかないませんね。

クレージーな人たちがいる
はみ出し者、反逆者、厄介者と呼ばれる人達
四角い穴に 丸い杭を打ち込む様に
物事をまるで違う目で見る人達

彼らは規則を嫌う 彼らは現状を肯定しない

彼らの言葉に心を打たれる人がいる
反対する人も 賞賛する人も けなす人もいる
しかし 彼らを無視することは誰にも出来ない
何故なら、彼らは物事を変えたからだ

彼らは人間を前進させた

彼らはクレージーと言われるが 私たちは天才だと思う
自分が世界を変えられると本気で信じる人達こそが
本当に世界を変えているのだから

むずでょむずでょ 2014/10/19 10:52 どうやって プログラムの仕様を ひょいひょい ひっかえとっかえできているのか謎だぜ☆ww アルゴリズムってそんなに ひょいひょい変えられるものなのか☆ww チューニングも全部無駄になってしまいそうな気もするし☆www 仕様変更に強い開発手法みたいなのがあるのだろうか☆www

茶田茶田 2014/10/19 21:33 「今回のやねうら王のテーマは未来なので完成するのも未来でしたー!」って言って出場辞退するのはやめて下さいね

鳥 2014/10/22 22:56 山本氏は勝率70%はまだいっていないような発言を最近していましたよ。
第2回電王戦のPonanza=2013バージョン
第3回電王戦のPonanza=2014バージョン(2013に勝率7割)
という意味ではないですか?

yaneuraoyaneurao 2014/10/22 23:49 ↑え、そうなんですか…。もしかしてAperyとPonanzaとAWAKEって同じぐらいの強さなのかな…。これは大波乱、あるでぇ〜。

はっほーはっほー 2014/10/23 04:41 自作パソコンと最新のPCでR400も上がりますかね…
GPS将棋の話では、1手深く読むとR100くらい上がるとのことでしたが、4手さらに深読みするのは難しそうですし

yaneuraoyaneurao 2014/10/23 12:20 ↑Bona6あたりでもnps(探索速度)が倍になるとR150になります。最近のソフトだと探索技術も評価関数の精度も格段に上がっているのでnpsが倍になったときにはもう少し上がります。おそらくR200ぐらい。

5万円の自作PC(Corei7 4771) = 4コア,最新PC = 16コアでクロックやや高め、メモリ帯域も向上しているので、実効npsとして2.5倍〜4倍ぐらいになります。

ここを楽観的に見て、仮に4倍だとすると、R200×log(2)4倍 = R400 という計算です。

お 2014/10/23 12:51 確かに、最近こういうツイートありましたね
https://twitter.com/issei_y/status/522309851368546304

yaneuraoyaneurao 2014/10/23 13:29 ↑ありがとうございます。本文に追記しておきました。

茶田茶田 2014/10/23 19:44 Ponanzaの2013年(3月)電王戦版に2014年電王戦版(最後に手を加えたのは2013年11月)は7割勝てて、半年前(2014年4月)の版に2014年10月版は70%には行ってない、ということですよね。それなら2013年11月から2014年10月の間の改善を考慮に入れて、2013年11月版に対して2014年10月版は70%越えてるかもしれないですね。

お 2014/10/24 01:24 そっか、隣のツイートを良く読むと「半年」のキーワードがありますね
>この「半年」、7年間で一番コンピュータ将棋を触ったけれど一番勝率の改善がすくなかった・・
https://twitter.com/issei_y/status/522309672313692160

茶田茶田 2014/10/24 19:51 考慮に入れるのは2013年11月から2014年4月の間でした。

それはそうととうとう残り一週間なのでマジハラハラしてます。将棋が好き過ぎて頭がおかしくなった人たちにいい将棋で勝ってくださいね。

yaneuraoyaneurao 2014/10/24 21:37 ↑私もプログラムが好きすぎて頭がおかしくならないと勝てなさそう..(´ω`)

り 2014/10/24 21:50 鏡像問題の文章を読むと『P1, P2が鏡像関係ならf(P1)=f(P2)』に見えるし、もしそうなら 5*abs(x1 - 5)+y2 ???私は何か勘違いしてるのかな?

yaneuraoyaneurao 2014/10/24 21:55 ↑それ1駒の話ではないですか?2駒ですぞ。「31金と72金」の2駒が存在する盤面と、「32金と71金」が存在する盤面は鏡像関係にあります。(x1,y1,x2,y2) = (3,1,7,2) と(3,2,7,1)が同じidを返さなければならないです。

yaneuraoyaneurao 2014/10/24 22:46 ↑本文、私の書き方がわかりにくかった気がするので修正して、例として追記しました。

休主休主 2014/10/24 23:08 ・P1 != P2 でしょうか?
・問題と直接関係なくて恐縮ですが、駒20種とは、先手駒10種と後手駒10種(金と同じ動きの成り駒は金とみなす)ということでしょうか?

yaneuraoyaneurao 2014/10/24 23:13 P1 == P2も含まれます。(KP1P2でP1==P2のとき、これをKPとみなすので。)

> 駒20種とは、先手駒10種と後手駒10種

正解です。歩・香・桂・銀・金相当・角・馬・飛・龍の9種類×2 = 18。そこに手駒も1つのP(駒)とみなします。(Bonanza6はそんな感じになっています)

ここに、さらに後手の玉を加えて20とすると、KPPにKKPが含まれることになってKPP配列だけですべてが綺麗に表現できます。

り 2014/10/25 15:24 ぬ゛ぬ゛。やはり私の勘違いでしたか。1駒用鏡像id算出関数をf()として、f(P1)、f(P2)、それとP1とP2が5筋の同じ側にいるのか違う側にいるのかを表現する1ビット(ツンデレビット)の3つの数字を使うようなものがいいのかな。この解は設問の条件を厳密に満たす解ではないが実用度を考慮したら100点満点で15点くらいにはならないか?

yaneuraoyaneurao 2014/10/25 17:35 ↑ツンデレビット、面白い表現ですね。片方の駒が5筋にいるときに、ツンデレビットが無駄になるので欠番が出るので(それでも実用的に十分ですが)、そこの欠番を詰めて、かつf(P1) <= f(P2)を保証するように欠番を詰めてあれば完璧ですね。この数え上げは高校の数Iの範囲ですね…。

dpsdps 2014/10/26 12:30 やねうら戦法の完成はいつ頃ですか?

トラックバック - http://d.hatena.ne.jp/yaneurao/20141015

2014-10-01 第二回電王トーナメントPVの撮影が終わりました

[] 第二回電王トーナメントPV撮影が終わりました  第二回電王トーナメントPVの撮影が終わりましたを含むブックマーク  第二回電王トーナメントPVの撮影が終わりましたのブックマークコメント


第二回電王トーナメントPV撮影が昨日あって、そこで今大会抱負とか意気込みとか何かそういうのしゃべったのだけど、そもそも、んなもん何もねえんだよ!ヽ(`Д´)ノ


開発のモチベーション全然上がらないし、コードも1行も書いてねーよ!ヽ(`Д´)ノ


なんでモチベーションが上がらないのか自分でもわからん…。というか、なんでお前ら、そんなにヒートアップしてるんだ?それが信じられん。お前らは熱帯雨林気候か知らんが、こっちはツンドラ気候である。お前らはアゲアゲかも知れんが、こっちはサゲサゲなのである。お前らは追い越し禁止かも知れんがこっちはインポなのである


f:id:yaneurao:20141001031244p:image


何故自分モチベーションが上がらないのか、インタビュー中もずっと考えていたのだが、例えば、前回の電王戦でお世話になった、将棋観戦記者松本博文さん。松本さんは東大法学部卒業して、それで将棋観戦記者になっている。東大将棋OBであり、自身将棋の棋力も相当なものだ。東大法学部出れば、もう少しマシな仕事につけそうなものだけど(余計なお世話か)、将棋が好きすぎておかしくなった感がなくはない。



また、東大法学部卒と言えば将棋連盟の片上理事である将棋トレーニングによって能力が開花して東大法学部レベルの頭脳になるのか、それとも東大法学部レベルの人を惹きつける魔力が将棋自体にあるのか。そのへん、私にはよくわからないが、ある知能集団に対して、将棋自体には抜け出せなくなるような重力があることは間違いない。


将棋が好きすぎておかしくなっても、HEROZの林社長のように将棋ウォーズのようなアプリ商業的に成功するパターンもあるので、将棋が好きすぎておかしくなったから駄目だと言うわけでもないのかも知れないが…。


ともかく、将棋にこれ以上関わるのはヤバイと俺の本能が言っている。「これ以上、将棋を好きになってはいけません」と俺の本能叫び続けている。俺様の卓越した頭脳将棋なんぞに使ってはならないと俺の直感警鐘を鳴らしておるのだよ。


それでも今月は電王トーナメントに向けてじわじわ自分モチベーションが上がると思うのだが、『ケイオスリングス3』の発売が10月16日なんだよな…。*1 発売になったらやらざるを得ない。一体、なんてことしてくれるんだよヽ(`Д´)ノ 先月、夏休みセールとかで安くなってたiOS用の『STEINS;GATE』まだ終わってねーんだけど!こりゃ、ゲーム業界が俺を殺しに来てるな。やねうら王の最大の刺客PonanzaでもAperyでもなく、『STEINS;GATE』と『ケイオスリングス3』だ!


…などということをPV撮影のときに言えるはずもなく、本当にPV撮影gdgdになってしまった。佐藤映像の人、本当申し訳ない。…。うまく編集して、アゲアゲな感じにしといてください。


ちなみにやねうら王の今回のアピール文書は、こんな感じで出しておきました。


f:id:yaneurao:20141001031245p:image


何度も言うようにまだ一行もコード書いてない&モチベーション0の状態からのスタートで10月16日からは『ケイオスリングス3』に没頭する予定だからな!ヽ(`Д´)ノ

yoshiyoshi 2014/10/01 03:59 アピール文、これ凄いですね。
これで強かったら新たなぶれいくするー誕生じゃないですか
時間ないけど形になるといいね!
シュタゲどうですか?終わったら感想たのむ!

Ta(ryTa(ry 2014/10/01 10:56 インポではない方はハミキン

猫田猫田 2014/10/01 19:46 ×「追い越し禁止」
○「追越しのための右側部分はみ出し通行禁止」(通称ハミキン)
と言いたい訳ですね

ジャックジャック 2014/10/01 22:17 将棋ってルールが絶妙なんでしょうね。
オセロ程単純じゃなく囲碁程難しくない。

ウィキペディア オセロ

オセロはルールが単純であるため、古くからプログラミングの教材として、あるいは実際の製品としてコンピュータ上で開発されてきた。

タッグマッチ 紹介文
阿部光瑠 四段
「ヒカルの碁」を読み、囲碁棋士を目指すが、ルールが分からず将棋棋士になる。

yaneuraoyaneurao 2014/10/02 02:06 ↑*4 シュタゲの感想は近々書くかも。
↑*2,3 なるほど。「追い越し禁止」と標識の下に書いてないのはハミ禁なのね…。
↑*1 10年後には「将棋電王戦を観てコンピューター将棋プログラマーを目指すが、コンピューター将棋は強くなりすぎていたので、コンピューター囲碁プログラマーになる」という青年が出てくるかも知れませんね。

納得納得 2014/10/03 00:32 やねうら未来の党はここですか?

茶田茶田 2014/10/03 20:00 パズルを趣味とする人はそうでない人より有意に年収が高いそうですが将棋の場合はどうなんですかね。

未来型やねうら王に電王トーナメント優勝の箔を付けて販売されるのを待ってます。

YOSIYOSI 2014/10/04 09:21 ケイオスリングスを今まで知らなかったです。VITA版では過去作品も同梱されるんですね。残業ばかりで給料増えても使う暇ないので、VITAも埃をかぶっているし買ってみようかと思ったり。携帯ゲーム機なので隙間時間に遊べるかな?

AMAM 2014/10/04 11:49 この新型やねうら王は斬新で素晴らしいですね。
前回出場したバージョンより強くなってたら神ですね

ところでコンピュータが考えた定跡ってどんな感じですか? 
従来の戦型(矢倉,横歩取り・・・)にはならないんでしょうか。

coffecoffe 2014/10/04 21:01 アピール文を見るとワクワクしますが
絵に描いた餅にならないことを祈っています

ろ過ろ過 2014/10/08 00:03 特徴1・2・3を言葉通りに取ると、「新やねうら王は新やねうら王同士の対局のみから学習し」「全く新たな評価関数と定跡を生み出す」事になると思うのですが、正しいですか?
つまり、プロ棋士の棋譜を学習するのが駄目なのはもちろん、プロ棋士の棋譜を学習したコンピュータの棋譜も使わないという理解であってますか?という質問です。

yaneuraoyaneurao 2014/10/08 02:07 ↑*1 そのつもりですが、条件的に厳しいようであれば、将棋ソフトによる棋譜は評価関数のパラメータの調整のために使うかも知れません。
↑*3 コンピューターが考えた定跡の例としては → http://d.hatena.ne.jp/yaneurao/20140310#p1とか。
↑*5 X=将棋とかパズルとかとして、「Xを趣味に持つ人と持たない人との年収の比較」をする場合、趣味に持たない人に、それが(能力的に)できない人が含まれてしまうので(能力的に出来ないのは知的障害者などで彼らの年収はかなり低い)、そういう統計が意味のあるものになるのかどうか…。まあ、将棋にせよ、パズルにせよ、知能を高めるトレーニングにはなると思いますが。

aa 2014/10/12 20:30 新機軸で行くんですね。やる気が出ないとのことですが、正直楽しみですw時間がありませんが、往来のやねうら王と同程度の強さまで持っていけそうですか?

「Xを趣味に持つ人と持たない人との年収の比較」は例えば東大出身者などの層別をしてから比較したら面白そうですね。

>将棋のトレーニングによって能力が開花して東大法学部レベルの
>頭脳になるのか、それとも東大法学部レベルの人を惹きつける魔
>力が将棋に自体にあるのか。

n=2であれですが、単純に広い意味で「優秀」な人は高学歴になりやすく知的ゲームに惹きつけられやすいということでしょう。「優秀さ」は幅広い概念で一概には言えませんが、例えば将棋の演繹的な能力はIQと相関するでしょうし、記憶力その他の「優秀さ」も互いにそうであると考えるのが自然です。もちろん、重みは不明ですが後天的な能力開発の面もあるはずです。

以前、東大と棋士の優秀さについて、ざっくりと参加人数との割合で考えてみたことがあります。東大3000人を一世代100万人のトップ、棋士161人を将棋人口20万人のトップ(将棋倶楽部24からラフに推測)と考えて正規分布でえいやとなると、東大偏差値77.5、棋士偏差値81.5。母集団の質と本気度、それぞれの「能力」の違いはありますが、ある程度の相関があるとすればそのような傾向があることはむしろ自然かなと思っています。

やねファンやねファン 2014/10/12 21:04 今回で電王戦は最後ということで
再び真剣勝負の場で真剣なやねうらおさんが観たいので
どうかモチベーションを上げていただいて、勝ち抜くことを願っています。

名無し名無し 2014/10/12 21:11 やねうら王の探索木の表示をBM98風にしてください

たろうたろう 2014/10/12 21:13 PV観てきました。相変わらずドワンゴは悪意をもって
ましたね。

応援してるので
電王トーナメント楽しみにしてます。

ただ一点だけ。
バグだけは取り除いてください。

り 2014/10/12 21:30 アピール文書見ると以下の点に気が付きました
Puellaαみたいに複数CPUへの分散処理工夫したよみたいなアピールがほとんどない。
ndfの「駒の相対的な位置関係」を特徴に取り入れたよというアピールがほとんどない。

そんなもんなんでしょうか???

やねうらおさんには当然の事ながら将棋ソフトも期待していますが
服装も期待しています。去年はいちにゃんさってまたいちにゃん
でしたが、今年はどんな服で出場されるのか!

さつまいもさつまいも 2014/10/12 21:32 PV見ました。
やねうら王のトーナメント優勝&電王戦勝利を期待しています。
批判もあるでしょうが気にされる必要は無いと思います。

wrsswrss 2014/10/12 22:54 PVのコンピュータ将棋の歴史?の下りの棒読み感に大爆笑ですw
また、以前のブログで1手詰めルーチンは大事だと書かれてましたが、それを使わないんですね。
今年のやねうら王がBonanza、NDFに続くブレークスルーになる事を期待しています。

お 2014/10/13 11:26 確かにgdgdでした・・・うらさんがカップラーメンを原爆で沸かす人はいないとか。そんな在り来りな比喩は既存の考えの延長線上にしかないように思うんです。せっかくならカップラーメンで発電してください。

ジャックジャック 2014/10/13 15:54 GPS将棋は何故出場しないのか?
YSSは何故出場しないのか?
ツツカナは何故出場しないのか?
NineDayFeverは何故出場しないのか?
Bonanzaは何故出場しないのか?
激指は何故出場する事にしたのか?
メカ女子はなんの為に出場するのか?

かずかず 2014/10/13 18:03 開発者が求めるべき究極の発想だと思います。
最も困難かつ遠回りのようで、最も将棋の真理に近づける発想だと思います。
是非とも完成させてください。
これほどのワクワク感は久しぶりです。

odakinodakin 2014/10/15 10:59 「なんでモチベーションが上がらないのか自分でもわからん…」ってのが、めっちゃくちゃ優秀だけど自分のこととなるととーんと分からなくなる天才、っぽくて可笑しかったです(すみませんw)

前回あんだけ編集されて、自分をまったく知らない多くの他人の悪意に晒されたらモチベーションが上がらないのはものすごく自然なことだと私は思うけど。

でも応援してるんで頑張ってください!(なんか口ばっかですみません…)
今回もやねうらおさんの御成果を楽しみにしています。

トラックバック - http://d.hatena.ne.jp/yaneurao/20141001

2014-08-14 もう電王トーナメントの季節がやってきたのか…

[] もう電王トーナメントの季節がやってきたのか…  もう電王トーナメントの季節がやってきたのか…を含むブックマーク  もう電王トーナメントの季節がやってきたのか…のブックマークコメント


早すぎだろ。まだ何もしてないぞ。電王トーナメントエントリーするかどうかすら躊躇うレベルだ。

そして全くやる気が沸かない。こりゃ今回は駄目かも知れんね。


ところが、先週から息子(5歳)が将棋を始めた。くもん出版将棋盤を嫁が買ってきたのだ。駒に移動できる升が書いてあるので息子にもわかりやすいようだ。息子に将棋を教えていると何か将棋熱が戻ってくるかも知れない。


NEW スタディ将棋 (リニューアル)

NEW スタディ将棋 (リニューアル)


息子に将棋を教えていると次の将棋格言おかしいことに気づいた。


f:id:yaneurao:20140814030139p:image


飛車当たりに香を打つ」の意味で、「飛車取りに香を打つ」と言うから、「両取り」も別に使ってもいいのではないかと言われるかも知れない。ちょっと待って欲しい。「飛車取り」は放置すると次に飛車が取れる。


「お湯をわかす」って言葉があるだろ?実際に沸かしているのは水なのだけど、その結果、お湯になるので、それを先取りして書いてあるわけだ。これを修辞学では「予期的叙述法(prolepsis)」と言う。「飛車取り」という表現はこれに該当する。だから、これはレトリックとしてアリなわけだ。


しかし「両取り」は放置しても次に両方は取れない。放置してたらその次にもう片方も取れますよね、と言われるかも知れない。それは大間違いだ。


その代表格が「桂での両取り」だ。先手が5九桂で後手に両取りをかけた場合、後手が何手放置し続けたらもう片方を取れるというのか。敵陣まで行って、桂を成ったあとそれを自陣まで引いてこないといけないんだぞ?そんなプロの実戦譜を見たことがあるか?ないだろ。ないない。そんなに後手は放置するはずがない。要するにそんなことは現実的に起こりえない。だから予期的叙述法ではない。使ったら駄目、絶対!


というのが私の考えなんだけど…


同じ理由で将棋の戦法の「縦歩取り」戦法というのもおかしい。普通は実際に歩が取れるわけではないので(本当に歩を取らせた羽生さんの実戦例があるが)、「縦歩狙い」戦法ではないかと思う。この「縦歩取り」という命名をしたのは、確か加藤 治郎先生だったと思うが、その著書『将棋は歩から』という本のなかで、「読者の方から、魚釣りは魚が釣れなくても魚釣りと言うので、縦歩取りも歩が取れなくても縦歩取りと呼んでいいのではないかという意見をもらった」というようなことを書かれていたと思う。


おお、そうか…。じゃあ「縦歩取り」はいいや。でも、「両取り」だけはワシは認めんヽ(`Д´)ノ


なんてことを考えてたら、また私のなかの将棋熱がにわかに戻ってきたかも知れん…。


そういや、最近、私は音楽制作に夢中なんだけど、そろそろいいヘッドホンを買おうと思って、評判のいいBeats by Dr.Dreヘッドホンamazonで買ったんだよ。ちょうどamazonがネット最安で25,480円だったんでな…。



ところがこの良さが全くわからん。以前から使っている千円で買ったヘッドホンとほとんど変わらん。曲によっては低音と高音がよく鳴ってるなーという程度。俺の耳は一体どうなっているんだ…。もしかして豚に真珠とはこのことか。いやいや、違いはわかるんだよ。違いは。


例えば、このヘッドホンをつけてからというもの人様の演奏動画で以前は気にもならなかった録音時のシャーっとかザリッとか言うノイズが気になるようになった。確かにノイズが超鮮明に聴こえる。このヘッドホンは大変素晴らしいものだ。こんな小さなノイズまでクリアに聴こえるだなんてな!ただ、ノイズが気になるぐらい聴こえるのはデメリットであって、メリットじゃないよな…。こんなものに25,480円か。また金をドブに捨ててしまたか


こりゃ、電王トーナメントの賞金もらって取り戻さないとな…。第二回電王トーナメントはありまぁす!もとい、第二回電王トーナメントに出場しまぁす!

チャモアンチャモアン 2014/08/14 06:05 将棋電王戦はプロ棋士との拮抗した勝負が難しく(現状、棋士の先行逃げ切りか、一度良くなったソフトがそのまま差を広げる2パターンしかない。例外は船江戦のみと思う。よって、一度形勢がソフトに振れると一気に冷めてしまう)なっているので、継続困難と感じていました。ですが、菅井リベンジマッチを見て、二日制であれば好局(僅差の激闘)が期待できると確認!
将棋電王トーナメントはともかく、第4回将棋電王戦には反対でした。でも、今は二日制でどうなるか見てみたいです。(先行逃げ切り以外の展開が増えれば、対ソフト専門の準備時間も短縮できると思うので、トップ棋士も出場しやすくなるかも!?)

電王戦もやるとすれば、前回見られなかったバージョンの新しいやねうら王がラスボスになる予感がします。ご武運を。

ボイルドハンターボイルドハンター 2014/08/14 08:05 願わくば今回の電王戦は前回のような出場者を省みない運営による過剰な煽り演出等無しで、純粋に対局を楽しみたいものですね。電王戦トーナメント応援しています!

玉ねぎ坊や玉ねぎ坊や 2014/08/14 08:51 一年とは早いものですね。この電王戦関連が季節の風物詩になってきているようなわくわく感があります。新やねうら王の電王トーナメント 楽しみにしています。またこの短期間でさらなる進化を遂げるんでしょうな。

とおりがかりとおりがかり 2014/08/14 12:47 ハンデがないとソフト勝ちなので、プロだけ持ち時間増やすしかないですね
ノートパソコンにスペック落とすしかないですね
それでも去年よりレート上がるのでしょうかね

隠れファン隠れファン 2014/08/14 16:33 またやねさんのトークが見れると思うとwktk

将棋ファン将棋ファン 2014/08/14 21:47 人間に勝ったくらいで満足しないで
将棋の神(に近いもの)を創り出して下さい
やねうら王2014を楽しみにしています!

YakitoriYakitori 2014/08/14 23:30 ヘッドホンについては、ノイズが聞こえるから音を製作するときにそのノイズを落とすのが主目的じゃないでしょうか。
ソースのノイズはどうしても消すの面倒ですから。

それと、電王トーナメント出場なさるのですね。
今年も名試合を期待しています。そして勝ってください。
やねさんの理論はせかいい・・・えーっと。えっと。とにかくすごいので、期待してます。

lunapiglunapig 2014/08/15 00:16 勝負したいb

Ta(ryTa(ry 2014/08/15 09:31 まさか頭にUSB端子が付いていて…

ニコ厨ニコ厨 2014/08/16 05:01 できれば将棋にかかわるのはやめてほしいです。
もう醜いものは見たくないので。

名無し名無し 2014/08/16 08:42 beatsはファッション寄りのブランドで音質的にはイマイチなので、音楽制作には周波数特性がフラットなモニターヘッドホンがおすすめです。

納得納得 2014/08/16 21:39 >>ニコ厨
>できれば将棋にかかわるのはやめてほしいです。
>もう醜いものは見たくないので。

釣られてやるか・・・
紳哉しつこいよ紳哉

そういえば一昨年の塚田の観戦記書いた奴もこんな将棋は二度と見たくないとか書いてやがったな

名無し名無し 2014/08/17 00:28 とりあえず期日含めてルール守ってくださいね

 2014/08/17 06:57 >納得
いくらなんでも紳哉先生に失礼。
やねうらおに粘着してるのは本人が名乗ってる通りただのニコ厨だよ。しかも自演しまくってる奴だ。

1ファン1ファン 2014/08/17 07:16 1ファンとして、電王戦トーナメント出場及び勝利を期待しています。
niconico超会議などあらゆる所で排除されているように思えますが、やらせPVの件でああなったのは全てドワンゴの責任ですから。

ヘッドホンについて。
PC直差しだとノイズまみれになるのはやむを得ないと思います。USBやS/PDIF、FireWire接続できるヘッドホンアンプを試してみるくらいでしょうか(但し最低でも2万円以上の物で)。ポータブルアンプはS/N比が余りよろしくないので、据え置き型のが良いでしょう。
若しくはオープンエアのプロ用ヘッドホン(AKG等で販売してます)にして、雑音成分を外部ノイズでマスクするか(;´・ω・)

まだ変なのがわいているようですが、事の敬意を知った上で書き込んでいる連中は幼稚園児より頭が悪いとしか思えません。幼稚園児に失礼ですね。訂正します。一年経って帰ってきた山彦のような物ですね。
PVが消されている所を見ても、あらゆる面でドワンゴの不始末です。
気にせず頑張ってください。

bernbern 2014/08/17 13:39 技術者のはしくれとして応援してます!

コンピュータ将棋ソフトは現局面での詰み発見能力は比較的高いのですが、
先の手を探索する際、詰み(自玉、相手玉問わず)を絡めた読みがなかなか難しそうだと思ってます。
(例の△63香に▲31角成で有利、との錯覚等)

探索中の有利不利の判断を局面瞬間での評価関数で行っているためだと思いますが、
限られたスペックで、まさか無数にある局面一つ一つで詰め発見エンジンを動かす訳にもいかず……
(すみません、釈迦に説法ですね。。)

たとえば人間の読みだと、自玉に角を渡すと詰みが発生するから、
角を渡す攻めが可能なのは、
?即詰みがある
?攻めながら自玉の安全度を高める攻防手がある
のどちらかだな、という判断ができますが、こういったロジックが組み込めれば……

難しい終盤だと、こういったところで勝敗を決することが割とあるんですよね。
やねさんが上記のところをスマートに解決してくれることを期待しています!

……とはいえ、こんなところに開発工数や対局時のマシンリソースを消費するなら
他の課題を解決したほうが棋力が向上するのかもしれませんが。。

将来的には、やねうら王同士で対局を続け、先手(または後手)の勝率が100%近くとなり、
将棋自体の完全解析とはいかずとも、
「最強のソフトによる統計では、将棋というものは先手(または後手)が必勝である」といった
結論がでる日を夢見ております。

それでは。

kenken 2014/08/17 16:12 >いくらなんでも紳哉先生に失礼。

うーん、でも爽やかな第一局の直後に紳哉先生ご本人が公の場でそのような発言をしたのは事実だよね…。前言を撤回したのかどうかは未だ謎のまま。

最終局後の全体会見で一応謝罪っぽいことは言ってたけど、あれでは誰に対して何について謝罪したかったのかイマイチ分からなかった。裏ではキチンとした話があったものだと信じたいけど…。24点法へのルール変更強要を棚に上げて欠席裁判で一方的な批判をして、その後頑なにその話題をNGワードにしたりして徹底的に隠蔽工作した将棋連盟側を信じるのは難しいか。

とにかく、将棋は将棋連盟のものではないし、そんなことを言う権限などもちろんないので、雑音など気にせずに今後も開発および第二回大会頑張って下さい。

名無し名無し 2014/08/17 21:35 「評価値と読筋を記録する拡張」に基づく評価値ならびに読筋の送信がさりげなく義務化されてる(w

あと、入玉宣言が27点法のままだけど、本戦のルールの記載がないままですね。どうなってるんですかね?

あと、中途半端な稲庭模様排除ルール(引き分け狙いと審判が判断したら即失格ルール)が廃止されていることは評価できると思います。あれは酷いルールだった(ルール上、気に入らない試合展開になったソフトを失格にすることが出来るルールだったし)。

初心者初心者 2014/08/22 08:22 wktkすぎる!
応援してます
頑張って下さい‼

応援してます応援してます 2014/08/23 00:01 「弱い方」のやねうら王が、美濃囲いで居飛車穴熊を粉砕した将棋に感動したものです。
やねうらおさんが将棋プログラムへの情熱がなくなって、もっと強い方のやねうら王が日の目を見るのはないのかなと思っていたところの電王トーナメント出場宣言にうれしさがこみ上げました。
電王トーナメントでのご活躍を期待し、第4回電王戦を楽しみにします。

名無し名無し 2014/08/24 11:55 将棋の内容自体は素晴らしかったので,対局相手を不必要にあおるような発言をしたり,自身の勝手な解釈でルール違反をするのだけはやめていただきたい.
開発者が普通の発言をし,ルールを守ってさえいればやねうら王という将棋ソフト自体は素晴らしいものなので,開発者の言動でソフトの価値まで落とさないでほしい

 2014/08/24 15:04 煽り? 単に無知なのならしょうがないけど、少なくとも、

http://d.hatena.ne.jp/kanoke/

ここのまとめの3月23日以前の記事くらいは読んでから書き込んでね。

 2014/08/24 17:02 バラエティー番組のURLやん

 2014/08/25 00:41 バラエティー番組? どこが?

 2014/08/25 01:13 ああゴメン。最初意味が分からんかったけど、そこのURLのキャッチコピーのことね>バラエティー番組
それはともかくとして、そこの記事は上手くまとまってるので事情を良く知らない人には一読してほしいわ。

miemie 2014/08/26 16:20 単純にエンターテイメントとして電王戦を楽しんでいる者です。
断然コンピュータ側応援です。
やねうら王頑張ってください!

り 2014/08/27 06:50 パパの作ったソフトが羽生さんに勝ったんだよと息子に言える日が来るといいですね。ただ、個人的には羽生さんが出てくるのはどんなに早くても2〜3年後のような気がしますが。そういえば羽生さん予想では羽生さんがコンピュータに負けるのは2015年でしたっけか?

namnamnamnam 2014/08/27 11:36 トーナメントでのご活躍、とても楽しみにしています。
私はやねうら王はすくなくとも5位以内に入ると思っており、その上で、どうしても気になった事があります。
今回のルールで、やねうら王を狙い撃ちにしてるのか? と感じた部分は以下の箇所です。

-----------------------------------------
(第25条)
<前略>
事前研究の棋譜を取り込んで強くなる機械学習機能は認めるが、研究対局を妨げる仕様にしてはならない。
<後略>
-----------------------------------------

この文章自体に矛盾を孕んでいる事に、ルール策定に関わった人は本当に気付いていないのでしょうか?

局後学習の結果、ソフトの指し手が改良されるから「強くなる」訳であり、その結果いわゆる「なぞり」を回避する理屈なので、
局後学習を認める事 イコール 研究対局(ハメパターン探し)を妨げる事
ですよね?

それとも、「研究対局を妨げる仕様」の私の解釈自体が間違っているのでしょうか?
例えば、前回は手動で局後学習を実行していただいたそうですが、それが余計な手間となるので手動はダメ、とか?


なんだか嫌な予感がしてならないので、事前にルール策定者に確認を取るべきかと思います。

YakitoriYakitori 2014/08/31 18:47 ニコニコが人間vsコンピュータの図式を次回でやめるそうですね。ちょっと残念です。
将棋のサジェストウエアってどういう感じになるんでしょうね。

とにかく、大花火上げてかっこよく終わってほしいですね。

forggenforggen 2014/09/01 21:05 新作やねうら王楽しみにしてます。

ピンピン 2014/09/22 23:56 去年のバグがあったソフトに今どういう思いでいるか分かりませんが
先日のタッグマッチでやねうら王の手がほとんど見れなかったのは残念でした。
ああいうのも加藤先生の魅力ですから、本気で不満に思う気にはやはりなれないのですが。
明日はいよいよBブロックですね。2013年の佐藤慎一先生のように、
基本は自分の指したい手をソフトでチェックする為に使う、それが候補手と一致すれば当然ソフトと同じ手でも指すという使い方をでも
十分やねうら王の手や良さも引き出されると思いますが、もしソフトの手や評価をほとんど軽視されるようならそうはならないでしょう。
将棋に関しては実直な人だと思うので、良い使い方をしてくれると思っているのですが期待と不安が半分半分です。

ピンピン 2014/09/24 00:50 後手でしかも横歩だと直線的な展開になったら、最強のponanzaに勝つのは大変になるのでしょうが、それにしてもやねうら王の手を生かす工夫がほとんど見られませんでした、残念です。
新作やねうら王の将棋の内容に期待はあります。しかし既に書かれている通り今回のルールは矛盾と解釈の余地を多く含んだ、やねうらおさんから見ればはっきり言って不備だらけの代物でしょう。
どうか、今回のルールで再び無用なトラブルが起きる事のないよう祈ってます。

AnonymousAnonymous 2014/09/30 02:52 あらら、みなさん電王戦絡みのコメントばっかりで面白い話題にはノータッチですか。
こういう形式的な話題を楽しめる人って少ないですよね>やねさん

>同じ理由で将棋の戦法の「縦歩取り」戦法というのもおかしい。普通は実際に歩が取れるわけではないので

次にパスしたら歩が取れるわけで、やねうらさんの説によればこれは予期的叙述法で、おかしくないと思います。上で「飛車取り」はレトリックとしてアリと言ってるのに、縦歩取りだけ「普通は取れないから〜」なんて定跡の話を持ち出すのはダブスタでしょう(←ネタにマジレスするというネタですよ、念のため。笑)

で、「両取り」という言葉はみんな普通に使ってるわけですから、言葉が間違ってると考えるのではなく、「なぜ人間はそれを正当化できるのか? どういうレトリックが使われてるのか?」と肯定的に考えた方がいいと思うんですよ。

何かにつけて「言葉が間違ってる」と主張する人は、むしろ言語能力が低い人なのではないかと思います(無理数じゃなくて無比数の方がいいと主張する人とか)。

やねうらさんの間違いは
>しかし「両取り」は放置しても次に両方は取れない
この事実の解釈にあると思います。

私はしたがって「放置すると次に取れる」ことが「取り」の定義ではない、と解釈します。

単に自分の駒の利きが相手の駒に当たっている状態、すなわち「当たり」=「取り」なのだとすれば、「両取り」に何もおかしいところはありません。あるいはパスしても次に「どちらか一方しか取れない」と考えるのではなく、「どちらでも好きな方を取ることができる」と考えるとか。

yaneuraoyaneurao 2014/09/30 03:16
> 次にパスしたら歩が取れるわけで、やねうらさんの説によればこれは予期的叙述法で、おかしくないと思います。

これは確かにそうなのですが、「横歩取り」のほうは100%取るので、「縦歩取り」のほうだけ予期的叙述だとおかしいかなと。

> 「当たり」=「取り」なのだとすれば

これはまあそうなんですけど(そして、実際、その意味で解釈するのが世間的には普通なんですけど)、この手のテクニカルターム、あまり多義的に解釈できる余地を残すと用語として使いにくいので、もうちょっと意味を限定して使って欲しいなーとか思いながら書きました。はい。

YakitoriYakitori 2014/09/30 05:43 曖昧と柔軟を重んじた時代の言葉ですからね。
多義的に解釈できちゃうのは歴史といえるのでしょうか。
自分もそのケがあってさいきんの人に通じなくなってきて困っています。
自分の主義通りに何人もが解釈すると喧嘩を始めるようですし。怖いです。

トラックバック - http://d.hatena.ne.jp/yaneurao/20140814
 

人気blogランキング tokutoku777
1900 | 01 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2013 | 01 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2014 | 01 | 02 | 03 | 04 | 06 | 08 | 10 | 11 |


Microsoft MVP
Microsoft MVP Visual C# 2006.07-2011.06