Hatena::ブログ(Diary)

やねうらお−よっちゃんイカを食べながら、息子語録を書き綴る このページをアンテナに追加 RSSフィード

書籍化されたで! 監修したで!(`ω´) 絶版なってしもた 大好評発売中です! 少し書いたデ!(`ω´) これにもな!(`ω´)
解析魔法少女美咲ちゃん マジカル・オープン!

YaneuLabs / YaneuraoGameSDK.NET / 掲示板 / やねうらおにメール / twitter / プロフィール

 | 

2012-01-14 電王戦リアルタイム実況 by やねうらお

[] 電王戦リアルタイム実況 by やねうらお  電王戦リアルタイム実況 by やねうらおを含むブックマーク  電王戦リアルタイム実況 by やねうらおのブックマークコメント


[14:10] いまからこのブログ電王戦リアルタイム実況をいまからやっていきますtwitterにしようかと思ったのですが、長文になると思うので、ブログですることにしました。


[14:20] まず、電王戦が何であるかというところから解説します。電王戦とは、コンピューター将棋プロ棋士との対局です。この対局のスポンサーにはドワンゴがついています


コンピューター将棋側は、ボンクラーズという、去年の第21回世界コンピューター将棋選手権の優勝ソフトです。ボンクラーズ将棋倶楽部24で196連勝して、将棋倶楽部24で最高レーティングR3364に到達しました。


将棋倶楽部24プロ棋士もお忍びで指していますから、早指しでは実質的人間トップと同等以上と言えるのではないでしょうか。


遠山五段によると「プロ棋士ならば(将棋倶楽部24で)R2800以上」*1らしく、プロ棋士もお忍びで参加している将棋倶楽部24においてそのR2800以上を相手に9割程度勝ち越しているボンクラーズは、神がかっています


[14:25] このボンクラーズ今日1月14日10:20から米長会長と対戦しています。やたらめったらカッコイイ告知PVが用意されました。スポンサーとしてドワンゴがついているだけあって、いい出来栄えです。


米長邦雄永世棋聖 vs ボンクラーズプロ棋士コンピュータ 将棋電王戦 告知PV

D


[14:30] 今回の本戦の前にプレマッチがすでに開催されていまして、米長会長は秘策2手目62玉で定跡形を外しましたが、その後、入玉模様の将棋にしないといけないのに(?)争点を作ってしまい結果、惨敗。


米長永世棋聖コンピュータに敗れる 2011.12.21 - YouTube

D


将棋倶楽部24では1PCなのに将棋倶楽部24での最高レーティングの記録を樹立するぐらい強く、本日の本戦ではブレードサーバー6台で秒間1800万手を読むそうです。(ソースは以下の週刊アスキーの記事)


週刊アスキーの記事がWeb上で読めるようですので紹介しておきます


いよいよ決戦迫る! 米長永世棋聖vs.ボンクラーズ将棋電王戦両者の思いとは?

http://weekly.ascii.jp/elem/000/000/071/71892/


[14:35] 前置きが長くなりました。初手から現在までの手順と現在の局面を貼りつけておきます


先手:ボンクラーズ

後手:米長邦雄

▲7六歩 △6二玉 ▲6八飛 △4二銀 ▲3八銀 △5四歩

▲4八玉 △5三銀 ▲3九玉 △6四歩 ▲6六歩 △7二銀

▲6五歩 △同 歩 ▲5八金左 △6三銀 ▲6五飛 △6四歩

▲2五飛 △3二金 ▲7五歩 △8四歩 ▲2六飛 △7二金

▲9六歩 △8三金 ▲6八銀 △7四歩 ▲同 歩 △同 金

▲6七銀 △7五歩 ▲7六歩 △同 歩 ▲同 飛 △7五歩

▲7九飛 △7二飛 ▲1六歩 △6五歩 ▲9五歩 △6四銀左

▲2八玉 △8五歩 ▲7六歩 △同 歩 ▲同 飛 △7五歩

▲3六飛 △8二飛 ▲6六歩 △同 歩 ▲同 飛 △6五歩

▲9六飛 △7三桂 ▲1五歩 △7二玉 ▲7六歩 △同 歩

▲同 飛 △7五歩 ▲4六飛 △8三玉


f:id:yaneurao:20120114143023p:image



[14:40] 現在までの進行について簡単に私の見解を書いておきます。後手の米長会長の初手(第2手目)が注目されましたが、62玉。これはプレマッチの指し手と同じです。プレマッチで痛い目に遭ったのでもう62玉はないのではと噂されていましたが(米長会長自身も「普通に指す」とのことだったように思うのですが)、またもや62玉。これには驚かされました。


62玉は、定跡を外し、入玉を狙う手です。


真吾オジサンが書かれている次のような展開を狙う手です。

http://shingoozisann.blog48.fc2.com/blog-entry-775.html


現在の局面は、ボンクラーズ側が押さえ込まれかけている状況で、ボンクラーズから打開できないようになっており、これはもしかしたらボンクラーズ側は入玉されて負ける可能性も十分あります


[14:50] ボンクラーズBonanzaベースとしており、評価関数Bonanzaに近いものだと思います開発者伊藤さんは「(簡単な)入玉対策はしている」とのことでしたが、おそらく玉の位置に対して加点している程度のことだと私は推測しています。(中段〜敵陣に居る玉に対して加点する)


そういう意味ではBonanzaの弱点がそのままボンクラーズの弱点と言えそうで、Bonanza特に苦手なのが入玉模様の将棋です。


一発勝負では圧倒的な強さを誇るボンクラーズですが、今回の電王戦では米長会長宅のボンクラーズ米長会長は事前に十分研究をしてきたようで、この勝負は一発勝負とは言いがたいです。


プロ棋士レベルの人がコンピューター将棋を徹底的に事前研究をすればこういう評価関数の“穴”を見つけるのはおそらく容易で、そういう意味ではコンピューター将棋側は人間の事前研究通りの進行にしないようにするための工夫が必要だと思います。いまのコンピューター将棋には定跡を外されてしまうと指し手のランダム性があまりないので、そのへんが対人戦での今後の課題なのかも知れません。


[14:55] 局面はなかなか動きません。後手からこのまま積極的には動かずに、千日手模様にして1手1秒で指し、ボンクラーズに1手につき2分ずつ使わせて、ボンクラーズの残り考慮時間を1分にしてしまう作戦は有力だと思います


米長会長はそんなことを潔しとはしないと思いますが、コンピューター将棋開発者側はそういうことも真剣に考えておかないとプロ棋士との対局では足をすくわれかねないですね。


[15:00] さて、ここで、開発者お金がいくら入ってくるのか見ていきましょう。(多額の賞金がもらえるなら私も本気でコンピューター将棋を開発しようかなと思ったり…)


まず、今回の対局でドワンゴから日本将棋連盟に1,000万円。そのうちのいくらを対局者である米長会長が受け取るのかは公開されていません。ではボンクラーズ開発者である伊藤さんのほうにはいくら入ってくるのでしょうか?


f:id:yaneurao:20120114150437p:image

http://aleag.cocolog-nifty.com/blog/2011/10/post-a815.html


なんと0円!! 開発者には0円です!! うわー、マジですか。半分ぐらいもらえるのかと思ってましたが。0円とは…。


[15:05] 将棋プロ棋士はすべて日本将棋連盟に属していて、日本将棋連盟を通さずにプロ棋士と対局することは出来ません。これは米長会長コンピューター将棋との公式対局の禁止令を出しているからです。これに背けば日本将棋連盟から除名されるでしょう。すなわち、プロ棋士としてやっていけなくなります


コンピューター将棋のほうはCSA(コンピュータ将棋協会)というのがあるのですが、ここはコンピューター将棋開発者に対して何の効力も持っていません。コンピューター将棋開発者がCSAから何か恩恵を受けているわけではないからです。この意味において、CSAがコンピューター将棋開発者プロ棋士との対局禁止令を出すことは不可能です。


このような非対称性があるので、プロ棋士のほうだけが対局料をもらい、コンピューター将棋開発者のほうには1円も入ってこないという、とんでもない構図になっています。この状況をコンピューター将棋開発者から打破するのは不可能でしょう。


まあ、今回の電王戦渡辺竜王が解説者で、谷川先生など豪華メンバーなので、日本将棋連盟スポンサーからお金をある程度取るのは構わないと思うのですが、コンピューターソフト開発者へもお金が流れる仕組みになっていれば、コンピューター将棋の開発に興味を持つ人も増えて、もっと賑わうと思うのですが。


[15:10] 電王戦は、米長会長日記によるとこのあと5年かけて5回勝負を予定しているそうです。


f:id:yaneurao:20120114151924p:image

http://www.yonenaga.net/taisenroku.html


まり、毎年、電王戦ドワンゴから日本将棋連盟に1,000万円が支払われる予定になっています


f:id:yaneurao:20120114151925p:image

http://8154.teacup.com/yonenaga/bbs/2435


日本将棋連盟はそれらの対局すべて開発者には無償奉仕を強いるつもりなのでしょうか。


激指」のように市販ソフトならばソフト宣伝にもなるのでしょうけども(それでも1円も出さないのはどうかと思いますが)、市販ソフトとして売り出すつもりもないような個人の開発者にとってはどうなのでしょうか。


[15:20] 開発者に1円も流れないのは、ドワンゴ側と日本将棋連盟との電王戦契約条件がまずいような気がしますね。


ドワンゴ側はスポンサーなのですから、「対局の勝利者に賞金を300万円出す」みたいな優勝賞金を上乗せしても良かったのではないかと思うのですよね。


本当は世界コンピューター将棋選手権のほうにもドワンゴのようなスポンサーがついて、優勝賞金が出ると良いのですが、現状は優勝の副賞としてノートパソコンがもらえるだけですからねぇ…。


評価関数棋譜から学習のために8コアマシン3台を1年ぐらいぶん回しまくって、その電気代だけでも20万円ぐらいになりますし、しかも参加するのに参加費1万円かかり、遠方からですと宿泊費、滞在費がかかり、そしてクラスター化しないと優勝できないような現状において、PC代だけでも50万円ぐらいの出費にはなりますし…。


あと、世界コンピューター将棋選手権の決勝日に残る開発者はほとんどが東大関係者であるのが実情で、東大レベルの頭脳の持ち主が何千時間も投入して開発して(彼らの年収考慮し、その費やした時間を金銭に換算すると数千万円分の労働だと言えるでしょう)、それが道楽としてやっていて楽しいうちはいいですが、だんだん伸び悩んでくると開発をやめてしまう人も少なくありません。


そういう現状を打破するためにも世界コンピューター将棋選手権にも大きなスポンサーがついて欲しいなぁと思いますドワンゴさん、期待してますよ!!


[15:25] コンピューター将棋はいま上位ソフトはほとんど横並びになっていますBonanzaボンクラーズ激指、ponanza、GPS将棋などはほとんど強さが変わりません。(せいぜいR200程度の差)


飛び抜けて強いソフトがあれば別ですが、別にどのソフトでも大差ないような状況です。そもそも、どのソフトでも(最新のPC構成ならば)プロ棋士と互角かそれ以上でしょう。いい勝負をします。


しかし、事前研究をして良いのであれば、話は別だと言うのが今回の対局で浮き彫りになりました。


[15:35] ボンクラーズが66歩と合わせたところです。


f:id:yaneurao:20120114153940p:image


後手の34歩が角交換を生じさせて66歩の合わせは相当うるさいのではないかという渡辺竜王の解説。



[16:10] 現在米長会長、敗勢っぽいです。


先手:ボンクラーズ

後手:米長邦雄

▲7六歩 △6二玉 ▲6八飛 △4二銀 ▲3八銀 △5四歩

▲4八玉 △5三銀 ▲3九玉 △6四歩 ▲6六歩 △7二銀

▲6五歩 △同 歩 ▲5八金左 △6三銀 ▲6五飛 △6四歩

▲2五飛 △3二金 ▲7五歩 △8四歩 ▲2六飛 △7二金

▲9六歩 △8三金 ▲6八銀 △7四歩 ▲同 歩 △同 金

▲6七銀 △7五歩 ▲7六歩 △同 歩 ▲同 飛 △7五歩

▲7九飛 △7二飛 ▲1六歩 △6五歩 ▲9五歩 △6四銀左

▲2八玉 △8五歩 ▲7六歩 △同 歩 ▲同 飛 △7五歩

▲3六飛 △8二飛 ▲6六歩 △同 歩 ▲同 飛 △6五歩

▲9六飛 △7三桂 ▲1五歩 △7二玉 ▲7六歩 △同 歩

▲同 飛 △7五歩 ▲4六飛 △8三玉 ▲7六歩 △同 歩

▲同 飛 △7五歩 ▲7八飛 △4二金 ▲5六歩 △5三金

▲6六歩 △同 歩 ▲同 角 △6五歩 ▲5七角 △3四歩

▲6六歩 △同 歩 ▲同 角 △4四歩 ▲7六歩 △同 歩

▲同 銀 △6五歩 ▲4八角


押さえ込み型の将棋は押さえ込みが失敗した時点で必敗になりますので、仕方ない意味はあります大盤解説検討はほとんど打ち切り状態です。


米長会長、事前研究を活かしてボンクラーズの弱点を突き、ほぼ互角のまま進行してきましたが、局面ここに至り形勢はかなりボンクラーズ側に傾いているようです。


[16:40] お通夜モード突入です。激指検討モードではボンクラーズ側 +1280だそうです。


[16:50] コンピューター将棋はここ近年、R(レーティング)は急激に上がりました。ここ近年CPU進化は鈍化しており、ソフトボナンザメソッド以上の大きな発見があったわけでもないのに、です。


コンピューターソフトブレイクスルーボナンザメソッド以外ではdf-pnによる詰将棋探索を挙げる人がいるかも知れませんが、ボンクラーズは、Bonanzaベースですからdf-pnは使っていないはずです。


また、df-pnは通常探索中には呼び出すタイミングが難しく、呼び出すとその計算コストが回収できずに弱くなることも多々あり、なかなか使い所が難しいのです。


では何故、コンピューター将棋のRがここ近年で上昇したのかという話になるのですが、細かな改良によるところはもちろんあるのですが、対人戦(将棋倶楽部24)で記録的なRが出たのは、人間側の思考能力限界を超えてしまったのではないかと私は思うのです。


将棋の局面の形勢判断は人間がどれほど経験を積んでも局面を見ただけでは正確にすることは出来ず、少なくともある程度先の局面まで読み進める(頭のなかで局面を進める)必要があるわけですが、この読み進める速度は人間脳内情報伝達物質の伝達速度などの制約上、明確な上限があるのだと思います


そうなってきますと、100メートル11秒で走る人はいっぱいいても100メートル10秒で走る人はほとんど居ないことからもわかるように、機械人間限界付近能力を有するときに、機械10%程度の性能upをすると人類では太刀打ちできなくなる、というのはあるのかも知れません。


[17:00] 渡辺竜王によるとボンクラーズはR3300を超えているので、この時点で(このことから)短い持ち時間将棋では、人間(プロトップ)より強いと言えるでしょうとのこと。


ならば、来年以降の電王戦、4年もかけてゆっくりやっていていいのでしょうか…。PCがさらに進化すると、人間側に勝機がなくなり、興行的にもおいしい部分が終わってしまうと思うのですが。


[17:10] 来年以降の電王戦は、人間側が事前研究コンピューター将棋の穴を探し、本番でその研究手順通りに進めて勝つ以外の勝ち方が難しくなるでしょうね。


コンピューター将棋人間トップに9割以上勝ち越すというような状況になれば、世界コンピューター将棋選手権のような、コンピューター将棋同士の対戦をプロ棋士が解説するようなイベントもっと注目が集まるでしょうし、いいスポンサーがついて、優勝ソフトビッグな賞金が出るといいなぁと思います


[17:15] 米長会長投了


先手:ボンクラーズ

後手:米長邦雄

▲7六歩 △6二玉 ▲6八飛 △4二銀 ▲3八銀 △5四歩

▲4八玉 △5三銀 ▲3九玉 △6四歩 ▲6六歩 △7二銀

▲6五歩 △同 歩 ▲5八金左 △6三銀 ▲6五飛 △6四歩

▲2五飛 △3二金 ▲7五歩 △8四歩 ▲2六飛 △7二金

▲9六歩 △8三金 ▲6八銀 △7四歩 ▲同 歩 △同 金

▲6七銀 △7五歩 ▲7六歩 △同 歩 ▲同 飛 △7五歩

▲7九飛 △7二飛 ▲1六歩 △6五歩 ▲9五歩 △6四銀左

▲2八玉 △8五歩 ▲7六歩 △同 歩 ▲同 飛 △7五歩

▲3六飛 △8二飛 ▲6六歩 △同 歩 ▲同 飛 △6五歩

▲9六飛 △7三桂 ▲1五歩 △7二玉 ▲7六歩 △同 歩

▲同 飛 △7五歩 ▲4六飛 △8三玉 ▲7六歩 △同 歩

▲同 飛 △7五歩 ▲7八飛 △4二金 ▲5六歩 △5三金

▲6六歩 △同 歩 ▲同 角 △6五歩 ▲5七角 △3四歩

▲6六歩 △同 歩 ▲同 角 △4四歩 ▲7六歩 △同 歩

▲同 銀 △6五歩 ▲4八角 △4五歩 ▲7五歩 △8四金

▲7七桂 △6六歩 ▲5七金 △5五歩 ▲6五歩 △5六歩

▲6四歩 △5七歩成 ▲6三歩成 △4八と ▲5三と △4九と

▲同 銀 △6七歩成 ▲7四金 △同 金 ▲同 歩 △7八と

▲7三歩成 △同 玉 ▲6五桂 △6四玉 ▲7五銀打

まで113手で先手の勝ち



[17:30] 今回は米長会長は善戦したと思います


来年以降の電王戦でも後手の初手62玉のような定跡外しが主流になるのではないでしょうか。


定跡外しをしないとコンピューター側にランダムに戦形を選択されて、コンピューター側はどの戦形でもそこそこ指しこなすので人間側が不利だからです。


[17:35] 電王戦は、一度出場した将棋ソフトは原則的には2度は出られないという条件があります。同じソフトが二度出場できないとコンピューター将棋ソフト側は電王戦にどんどん弱いソフトが出ていくことになります


しかし「ぼんくりゃーず」とか将棋ソフト名を変えて別ソフトだと開発者が主張したらどうなるのでしょうか…。



[17:40] 電王戦に参加するのは世界コンピュータ将棋選手権の優勝ソフトではなく、「第22回世界コンピュータ将棋選手権の成績優秀プログラム*2という条件になっています


これはおそらく、「優勝ソフト」にしてしまうと「対局料もらえないなら、参加しないよ」と開発者に言われると困るからでしょう。


このへん、「優勝ソフト」にその出場の権利があり、「優勝ソフト」の開発者が出場を辞退したら2位のソフトというようにルールを明確にしていただきたいものです。


[18:30] ちなみに今年の世界コンピューター将棋選手権の参加の申し込みは今月末までです。


私は今年出場するかどうか悩んでいます。私が出場すれば運が良ければ優勝する可能性も十分あると思うのですが(トップ付近ソフトは横並びなので運次第)、事前にソフトプロ棋士側に提供しなければプロ棋士側が勝つのはほとんど不可能だということが今回の電王戦を見ていて良くわかったので、結果がわかっていることをしても仕方ないかなと思ったり。(特に無償奉仕はマジ勘弁)


[19:15] いま記者会見にて米長会長来年電王戦について驚きの発言が!


来年電王戦、5 vs 5、プロ棋士5人×コンピューター将棋5ソフト(?)での対局が開催されることに急遽変更になりました。


あと、「一年ごとに決着をつける」とのこと。つまり、毎年5 vs 5みたいな感じで電王戦が開催されるようです。いやはや、これには驚きました。これは俄然面白くなってきました!



■ 追記



米長永世棋聖「築いた万里の長城、穴が開いた」 電王戦敗北後の会見 全文

http://woman.infoseek.co.jp/news/entertainment/story.html?q=niconiconews_178307



・対局後のインタビュー記事。


電王戦観戦記 ほかではあまり語られない舞台裏

http://weekly.ascii.jp/elem/000/000/072/72605/

tombowtombow 2012/01/14 19:59 ラジオのニュースでコンピュータが勝ったと聞いて
お祝いに来ました!

yaneuraoyaneurao 2012/01/14 20:01 ここじゃなく、ボンクラーズの伊藤さんのブログにお祝いのメッセージを!!

山田 剛@CSA山田 剛@CSA 2012/01/15 15:14 お通夜に参列してきました。
ただ、内容は、コンピュータの序盤のヘタさ加減が白日の下にさらされたので、
真吾オジサン戦法の研究が進めば、これから人間側が巻き返す展開が期待できるように思いました。

yaneuraoyaneurao 2012/01/15 18:28 ↑そうですね。

62玉戦法(?)は、組み上げてしまえば(入玉できる形になれば)必勝なので、普通の将棋より早いところ(組み上げまで)で決着がつくので結果として大差に見えるだけで、今回の進行でボンクラーズの完封負けも十分あったと私は思っています。

この進行を回避するのは読みの絶対量を増やしてもあまり意味はなく、評価関数自体を入玉将棋に向けて改良していかないといけないのでしょうね。まあ、そうすると他のソフトとの対局ではRが落ちるので開発者的には気分が悪いのですが。

入玉のために評価関数をいろいろいじったコンピューター将棋側に62玉戦法を指させれば、他のソフトへの勝率upも望めるような気もしますが、62玉戦法が通用するのはBonanza系の評価関数のソフトだけかも知れませんし、そのへんどうなんでしょうね…。

 | 

人気blogランキング
1900 | 01 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 |


Microsoft MVP
Microsoft MVP Visual C# 2006.07-2011.06