Hatena::ブログ(Diary)

やねうらお−ノーゲーム・ノーライフ このページをアンテナに追加 RSSフィード

tokutoku777 tokutoku777 ランキング
電王戦出場記念! 書籍化されたで! 監修したで!(`ω´) 絶版なってしもた Kindle版で復活!! 記事書いたで!
解析魔法少女美咲ちゃん マジカル・オープン!

YaneuLabs / やねうら王公式 / やねうらおにメール / twitter / プロフィール

 | 

2014-03-10 やねうら王が将棋倶楽部24にきました

[] やねうら王が将棋倶楽部24にきました  やねうら王が将棋倶楽部24にきましたを含むブックマーク  やねうら王が将棋倶楽部24にきましたのブックマークコメント


やねうら王が将棋倶楽部24に参戦中です。


USIプロトコル(コンピューター将棋の思考エンジン標準的プロトコル)対応の思考エンジン将棋倶楽部24対応させるブリッジを書きました。実質的に8時間ほどでオートパイロット対応ができました。(詳しいことは書けませんが、ボンクラーズ将棋倶楽部24に来ていたときと違って、かなりやりやすくなっています。)


ちなみに将棋倶楽部24に、オートパイロットテスト用のサーバーがあるわけではないのでぶっつけ本番です。バグって落ちたときはご容赦を。


・2014/3/10 0:00


いま、動作テストのため一手5秒でやっています。負けが込むようでしたら、思考時間を増やします。


スマフォからしか挑戦が出来ないのは、久米さんの意向っぽいです。PCからの挑戦を受け付けると、再開局の処理とかがあって大変だからという配慮なのかも知れません。(よく知りません)


・2014/3/10 0:20


やねうら王はR2800スタートです。ここから落ちたら格好悪いので自ずとプレッシャーがかかります


ちなみに初手から定跡は使ってません。局後学習させた定跡のみです。もうコンピューター将棋はそろそろ初手から自分の力で切り拓くべきだという考えのもとにそうしてます。(まだ時代が2,3年早過ぎるかも…)


・2014/3/10 0:35


いま1手5秒設定のままR3009の人に勝てたようです。やねうら王は序盤が独自の定跡のために、あまり見慣れない形になります。(というか、たいてい序盤で悪くするのですが) いまの将棋も序盤早々に横歩を取られたのに、ごりごりやっているうちに逆転したようです。


開発者的には、もっと普通に指して欲しいんですけど、初手から定跡がないとまあこんなもんなんでしょうね。それにしてもR3000台の人とやって勝てているのが凄いですね。


ちなみに、やねうら王はレーティング対局室に移動したあと誰の挑戦でも受ける設定になっています。(早指し設定での平手挑戦であれば)


・2014/3/10 1:05


穴熊でR2968の人に負けました。(たぶん) さすがに1手5秒きついようですね。次から1手8秒に変更してみます。ちなみにponder(相手の手番で考える)は使っていません。(実装が大変そうだったので…) そして、投了の処理まわりがバグっていたので落ちました><

追記 → 間違えて、1手8秒+秒読み8秒の設定にしてたので16秒考えてました。うわー…。


あと、やねうら王、思考中の評価値が出たほうがいいという声が強いので、いまから対応します。10分ほどお待ちを..。


それからやねうら王は中断再開待ちに対応していません。(中断局スタートには対応しているはずなのですが…) 途中でやねうら王が落ちたような場合にはなんであれ判定勝ちにしてもらって構いません。ご迷惑おかけします。


・2014/3/10 1:30


価値表示に対応させたのですが、対局中は全体チャットにはならないので対局相手にだけ見えるチャットになるようです。全体チャットAPIはないようなので、これは駄目ですね…。他の仕組みを何か考えます


・2014/3/10 1:40


1手8 16秒設定でもR2900は超えそうな感じです。思考時間を倍にするとR150ぐらいあがるのでR3200にギリギリ到達可能なのかなと思います人間側は相手番で考えることが出来る&将棋倶楽部24R3000付近の人は数少ないので、そう単純な話でもないですが。


・2014/3/10 1:50


人間側が手待ちして千日手っぽい局面に。この手の局面は打開するのにかなり先まで読まないといけないので8 16秒では打開不可能かと思っていたところ、やねうら王が無理やり打開。そして凄い損を…。おまけに人間側、そのまま入玉狙い。いきなりアンチコンピューター戦略で来る人がいるとは思いませんでした。将棋倶楽部24は一昔前とは全然事情が異なるようですね。


入玉対策は一朝一夕に出来るものでもないので、開発者的には大変です。やねうら王は入玉対策はほとんどやってないです。


ちなみにfloodgateでも入玉比較的上手い組と下手な組と分かれていて、入玉対策を真面目にやらないと数局に1局ぐらい入玉絡みの将棋で負けてしま勝率がぐんと落ちます


・2014/3/10 2:15


今日の対戦はここまで。一晩また局後学習させておきます

対戦していただいた皆様、観戦いただきました皆様、本当にありがとうございました


明日も22時ごろから参加します。明日、また続きをここに書きます


明日は評価値リアルタイム更新がやねうら王公式サイトのほうから確認できるようになってると思います


Dropboxのpublicフォルダに評価値と読み筋を書いたhtmlファイルを突っ込んで、それを上記サイトのiframeのなかで表示しているだけという驚くべき手抜き実装です。


・2014/3/10 9:00 去年とは周囲の反応が違うという話


去年ponanza将棋倶楽部24に来たときは席主である久米さん公認でやっているのに、チャットでは「ソフト使って将棋倶楽部24で指していいの?久米さんに通報しなきゃ!」みたいなことを言い出す人が多かったので、やねうら王もそういうことを言われるんだろうなぁと思って覚悟して臨んだのですが、蓋を開けてみればそんなことはなく、「待ってました!」と多くの人に声をかけていただけたことは、開発者冥利に尽きると思います


電王戦のおかげで、コンピューター将棋開発者スポットが当たるようになりました。時代は着実に移り変わろうとしています


・2014/3/10 21:00


設定間違えて1秒指しのままやってました。この対局終わったら修正します。

→ 1手15秒に修正しました。1手1秒のままR3000ぐらいの人に2局勝っていた模様…。

将棋倶楽部24では高段の人(でかつスマフォユーザー)は限られているため、同じ人との連戦になりやすく、そういう意味では、局後学習がかなり有効であるようです。(相手は同じオープニングをやってくる可能性が高いため)


・2014/3/10 21:35 R2914


昨日、相穴熊で負けた人との対戦。やねうら王は勝ちを拾って現在R2914。やねうら王は、私が思っていたより強いのかも知れません。


・2014/3/10 22:30 R2932


なんかnps(探索速度)が出ないなーと思って調べていたら思考エンジンと通信するスレッドの負荷率が100%になってました。実質3コアで頑張っていたようですね。この対局終わったら修正します。ついでに評価値の表示まわりも少し調整します。

→ 修正する予定が速攻で次の対局に突入してました。これ以上挑戦を受けない的な、停止予約の機能が要りますね…。

[22:45] 諸々修正しますので、この対局終了後、2,3分ほどお待ちを..。

[23:00] →修正しました。


・2014/3/10 23:03 R2944


人間側、入玉作戦を採る模様。R2937の人なのでこれは成功するのではないですかね…。まったく、将棋倶楽部24はハラハラしますね。


・2014/3/11 0:40 R2985


棒銀でやられました。いまのコンピューター将棋、レグスペとかでよくやられるんですよね…。最後は超熱戦でした。しばらく毎日21時ごろから将棋倶楽部24に参戦するようにします。



遠山先生といつもん先生からはやねうら王の独自定跡(!?)について、お褒めの言葉を頂戴しておりますありがとうございます

f:id:yaneurao:20140311011638p:image

https://twitter.com/funnytoyama/status/443014123098370048

f:id:yaneurao:20140311004445p:image

https://twitter.com/itumon/status/443041355602739200


・2014/3/12 0:30 やねうら王R3000突破


やねうら王、将棋俱楽部24レーティングが3000突破(2ch名人)

http://i2chmeijin.blog.fc2.com/blog-entry-364.html


かろうじて突破しましたが、入玉対策しないと同じ将棋で負け続けることはありえそうです。実に頭の痛い問題です。あと、R400以上離れている場合、挑戦を受けないように変更します。もう少し動作が安定してきたら、もう少し長い時間参戦させて、夜の21:00-24:00以外はこの制限なしに挑戦できるようにしようかとも思っています


・2014/3/12 4:00 入玉対策


さきほどの将棋入玉があまりにもひどかったので、ちょっと修正しました。今日の対局をお楽しみに!


人間の高段者の方と対戦する機会に恵まれるのは、ありがたいですね。普段はコンピューター将棋同士を対戦させているので気づかないような欠点が見つかって、開発者としては嬉しい限りです。(そして観戦しているときにすごく心臓に悪いです。)


あと、入玉判定のとき将棋倶楽部24では本来は「中断」→「引き分け提案」みたいな手順を踏むようなのですが、サーバー側での判定勝ちみたいな処理がないようですので、やねうら王が27/28点法の入玉宣言勝ちの条件を満たしたとき*1に引き分け提案のメッセージ強制的に送るようになっています。(まだこの状態になったことがないので、この処理が正しく書けているかどうかはわかりません。)


入玉されて負けだと思ったら、適当なところで投了していただければと思います。256手を超したところで無条件に引き分け提案を送るほうがいいかは検討中です。


・2014/3/13 2:00 中断局の自動再開を実装


公式サイトで表示されている読み筋で、局後学習DBに登録されていたときは「定跡の指し手」と表示されるように変更しました。


対局中に相手が落ちたときにやねうら王が自動的に待合室に移動して、5分間再開待ちを行うコードを追加しました。このへん、テスト用のサーバーもないので、ぶっつけ本番ですが、たぶん動くかと思います


一度でも負けた対戦相手とやるときは、思考時間29秒まで考えるようにしました。

いまのところ対戦相手に負けたかどうかの管理は手動ですが、気が向いたら自動します。

(スマフォの高段は特定ユーザーしかいないようで…)


対局中の将棋盤面を公式サイトの画面下部に表示するようにしました。これまた実テストできていないのですが、たぶん動くかと思います


・2014/3/25 20:45 やねうら王R3100突破


知らない間にR3112になってました。スマフォユーザーしか対戦できないので相手が偏っているので本当のレーティングはよくわかりません…。


・2014/3/26 21:00 再開待ちの修正しました。


相手側ダウンのときの再開待ちの処理がおかしいときがあったので修正しました。

現在R3131です。同じぐらいの相手が少ないのでRが上がりにくいですが、おそらく最終的にはR3200〜R3300ぐらいに落ち着くのではないかと言われています入玉絡みで負けることが多いのでその改良は4月になったらやろうかと思います

あと、ponder(相手番で考える)をするように修正することでR50ぐらいの伸び代があるはずなので、もう少し頑張れば、5万円PCでもR3300はギリギリ到達可能なのかも知れません。

[] やねうら王の読み筋と評価値の見かた  やねうら王の読み筋と評価値の見かたを含むブックマーク  やねうら王の読み筋と評価値の見かたのブックマークコメント


やねうら王公式サイト

http://yaneuraou.yaneu.com/


f:id:yaneurao:20140310035435p:image


やねうら王が将棋倶楽部24に参戦しているときは上記サイトの一番下のところでやねうら王の評価値と読み筋を見ることが出来ます


・centipawn = 歩1枚を100とする評価値単位。(一歩得であれば、相手の歩が1枚ない+自分の歩が1枚多い=+200)

・評価値はやねうら王から見た数値です。(やねうら王側が優勢であればプラスの値です)

・13手詰 = 王手ラッシュなどの攻防を含めた詰みまでの最長手数。詰将棋的な手数ではありません。

・-20手詰 = 20手で詰まされるということ

・評価値15000〜20000 = 優等局面(盤上の駒の配置は変わらず自分の手駒だけが増えているとき)の評価値

[] やねうら王2014の開発コンセプト  やねうら王2014の開発コンセプトを含むブックマーク  やねうら王2014の開発コンセプトのブックマークコメント


今一度、今年のやねうら王2014の開発コンセプトを書いておきます。(現バージョンのことではなく、今年はこういうことをしたいという話です)


・局後学習により、定跡を自らの手で切り拓く


これは、すでにやっています。9手目ぐらいまでは3200M(32億)局面を調べて、その局面よさげな手を上位3手、DBに記録しています。後手の6二銀などかまいたち戦法で有名なアマ強豪である鈴木英春さんを彷彿とさせる立ち上がりです。


人間棋譜から学習をやめる


コンピューターオセロのようにすでに人間棋譜が参考にならないというところまでは、コンピューター将棋はまだ来ていませんが、しか人間の(プロの)棋譜を大量に(100万局単位で)集めるのは不可能なので、どこかで人間棋譜と決別しないといけない時代は確実にきます。そこで実験的に人間棋譜を使うのはやめることにします。


過去コンピューター将棋関連の技術は一切使わない


日本コンピューター将棋開発は開発者間での情報共有があまりなされているとは言いがたい状況です。例えば、不特定多数オープンソースで開発されているようなコンピューター将棋存在せず、このへんコンピューターチェス世界からずいぶん遅れをとっています。そういうコミュニティの在り方が日本風土に合わないのか、あるいは、コンピューター将棋が辛うじて商用ソフトとして販売できてしまうという現実が、そういうコミュニティの発達を阻害してきたのかはわかりません。そのようなコミュニティを形成し、共同で技術を育てていけていないことは、ある意味では開発者たちの怠惰の結果と言えるでしょう。


ともかく、日本で開発されたようなコンピューター将棋技術は一切使わないという縛りを入れたところで、さほど開発上問題になるわけでもありません。こうすることで「いままで日本研究されてきたコンピューター将棋技術は(現代コンピューター将棋ソフト開発上において)全く何の意味もなかった」という烙印を押すことが出来ます


具体的には

ボナンザメソッドを使わない

Bonanzaの3駒関係を使わない

Bonanza型の1手詰めルーチンを使わない

Bonanzaの優等/劣等局面の判定を使わない

df-pn(詰将棋探索)を使わない

Puella αクラスター技術を使わない

などが挙げられます


私は、「保木さん(ボナンザ)がいなければやねうら王もなかった」だとか「プロ棋士がいなければ(プロ棋譜がなければ)やねうら王もなかった」だとか、一切言われたくないので、茨の道であったとしてもあえて独自路線で行きたいと思っています

NaNNaN 2014/03/10 02:29 思考5秒設定の時に約10秒、思考8秒設定の時約16秒使っていたように見えましたが、何かの設定ミスではないですか?

yaneuraoyaneurao 2014/03/10 02:34 ↑設定ミスでした。(持ち時間8秒+秒読み8秒になってました) 修正しました。ご指摘感謝!

amuseumamuseum 2014/03/10 18:49 後段、やねうら王2014で過去の技術は使わない、というのは、前段のオープンソース的な情報共有が無いことへの批評とは矛盾しませんか?

情報共有しながら開発するコミュニティを是としつつ、やねうら王はそれとは別に独自の道を歩み、オリジナルな技術を開発・公開してフィードバックしていく、という解釈で宜しいでしょうか。

yaneuraoyaneurao 2014/03/10 19:12 > オリジナルな技術を開発・公開して

コンピューター将棋には新たな技術を開発するまでもなくコンピューターチェスの探索技術や、一般的な機械学習の枠組みだけで十分だと私は考えています。また、公開に値する発見があれば公開するつもりです。

がーすーがーすー 2014/03/10 21:30 eval = N centipawn のNの符合(+or−)ですが、文脈全体から自明とは思うのですが、「先手から見た数値」ではなくて「やねうら王から見た数値」という理解で正しいですよね?
上の説明もその辺りの誤解の余地を無くす方向で書き足していただけるとよいのではないかと思います。

何はともあれ、やねうら王、待ってました!!!

100万円企画でのponanzaの圧倒的な強さもスゴかったですが、やねうら王も、一歩損からゴリゴリ逆転したり、投了寸前で落ちてみたり(あの将棋は負けでしたが、途中の攻防は見応えありました)、入玉されたり、ハラハラさせて愛されキャラになるかもしれませんね。あと、毎晩寝ている間に強くなるってのも楽しみです。
大いに楽しませていただきます。(寝不足にならないよう注意しないと。)

yaneuraoyaneurao 2014/03/10 21:46
> 「やねうら王から見た数値」という理解で正しいですよね?
そうです、そうです。書き足しておきました。

かえさるかえさる 2014/03/10 21:46 やねうら王独自技術楽しみにしています。コンピュータ将棋界がボナンザのDNAを持った単一種となってしまうと、必ず停滞期がやってくると思います。新しい方法論でトップレベルになるソフトの登場が待ち遠しいです。その心意気応援しています。最後に。再来週の電王戦、入玉されないこと祈ってます。

がーすーがーすー 2014/03/10 22:07 読み筋の表記の見方、だいぶ慣れてきて、楽しくなってきたところです。
しかし、読み筋を見せてしまうと、やねうら王の読み筋通りに指して勝つ人が出てしまうかもしれませんね。実質「やねうら王vsやねうら王」。たしか自己対戦だと押し切られやすいという話もありましたし、ちょっと問題かもしれません。ソフト指しバレバレにはなりますが。

名無しさん名無しさん 2014/03/10 22:49 読み筋表記を人間向けにする user.js を誰かさくっと作ってくれませんか

yaneuraoyaneurao 2014/03/10 22:52 ↑USIを普通の日本語の指し手表記に変換するには盤面情報が要るんです。ブリッジ部は実は完全な盤面情報はもっていないのです。(持つことはできますが面倒なのでやってないのです) ですので変換できないという…。ナンテコッタイ。また要望が多ければ考えます。

YTOYTO 2014/03/11 21:38 「いままで日本で研究されてきたコンピューター将棋の技術は(現代のコンピューター将棋ソフト開発上において)全く何の意味もなかった」
これはBonanzaが一度烙印を押してしまったような…。

yaneuraoyaneurao 2014/03/11 21:59 ↑はい、そうですね。Bonanza以降のここ10年近くの進歩というのも、あんまり芳しくないと私は思っています。

え??え?? 2014/03/11 22:41 > こうすることで「いままで日本で研究されてきたコンピューター将棋の技術は(現代のコンピューター将棋ソフト開発上において)全く何の意味もなかった」という烙印を押すことが出来ます。
(ネットでヤジられたであろう)主さんのお気持ちも理解できますが、こういう言い回しは大勢の先人達の普及のための尽力すら全否定する発言だとも受け取れるので、本当に止めた方がいいと思います。
どんなにつたないプログラムでも、世界で最初に将棋プログラムを書いた人がこの世界を切り開いたんです。心が痛くなります。

2ちゃんとかに負けないでください。

yaneuraoyaneurao 2014/03/12 00:14 ↑将棋およびコンピューター将棋の普及のための活動と、コンピューター将棋の研究成果とは全く別物だと私は考えています。前者はもちろん大いに評価しております。後者は、もしかしたら大した成果が出ていないのではないか(現在のトップレベルのコンピューター将棋プログラムにおいて使えるような技術は実は生まれていなかったのではないか)という疑問を持っているので、それを検証(実証)してみようということです。

その結果、「やっぱり日本のコンピューター将棋技術はすごかった」となるのか、その逆に「すごくなかったのか」となるのかはいまのところわかりません。

てすとてすと 2014/03/12 01:44 電気代が、大変なことになりそうですな(笑)。

制限なしに挑戦できるようになったとして、R1000未満は思考時間1秒でいいのではないでしょうか

yaneuraoyaneurao 2014/03/12 04:41 ↑遅いマシンにて1コアで回しておく、よわうら王(?)を4つぐらい投入して、棋力の低い人はそちらで遊んでもらうのもいいかも知れませんね。まあ…しかし、私は将棋倶楽部24からお金をもらっているわけでもないので、そこまで奉仕しなくてもいいかなとも思ったり。あとは時間ができたらブラウザでログインなしで遊べるやねうら王を作りたいのですが、まあやねうら王、もっと強くするのが先決ですよね…。

ぷ 2014/03/12 08:38 やねうら王がいつか将棋の神になった時、その過程に将棋にプロ棋士達の存在が必要ではなかったとすれば、
それはとても寂しいですね…
コンピュータが人を超えることよりもずっと悲しい…

DMSDMS 2014/03/12 12:32 よわうら王(?)もし実装されるのでしたら、雨風から屋根裏を守る伝統の合掌造りの屋根にちなんで"やねわら王"なんて名前はどうでしょう(笑

たまねぎ坊やたまねぎ坊や 2014/03/12 13:13 いま率直な疑問ですが、やねうら王電王戦verと2014ver(24投入のもの?)の違いってなんなんでしょう?確か電王戦verは開発時間が殆ど無かったため中身は殆どBonanzaだったような。違ってたらスミマセンm(__)m

yaneuraoyaneurao 2014/03/12 14:46 ↑*3 コンピューターオセロでは、人間の棋譜はノイズにしかならないので学習に使わないそうです。コンピューター将棋もいずれそうなるでしょうけど、それにはもっともっと先の話ですね。しかしそれによって、プロ棋士の価値が否定されるわけではないと私は思いますよ。
↑*2 ま、、まぎらわしい…
↑*1 コンピューター将棋の要である評価関数は全くいじってないのですが、多少強くなっているようです。(正確な計測はしてないのでよくわかりません) Bonanzaをベースにしていたのは3年前のバージョンで、2013年電王トーナメントのときにそれを取り壊してつくり直しております。

2424 2014/03/12 22:28 やねうら王楽しんでいます。
妙手か悪手か、なんだこれは、という構想もありますが、想像以上の強さです。
設定時間解除によるさらなる強化も楽しみにしています。

トラックバック - http://d.hatena.ne.jp/yaneurao/20140310
 | 

人気blogランキング tokutoku777
1900 | 01 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2013 | 01 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2014 | 01 | 02 | 03 | 04 | 06 | 08 | 10 | 11 | 12 |
2015 | 01 | 02 |


Microsoft MVP
Microsoft MVP Visual C# 2006.07-2011.06