気になったネタリンク

このブログはバラエティー番組です。

批判的な文章についてはその対象への励ましです。

また、間違った文章があった場合それはイメージ・演出であるため問題ありません。

 | 

2014-03-21 第3回将棋電王戦 やねうら王の棋力変化について

騒動はとりあえず収束。でも?

一応ドワンゴが謝罪したという形で騒動は収束しました。

(個人的には、まだ責任転嫁臭があるし、将棋連盟とやねうらおさんとの仲違いの仲裁最後までやらなかった辺り酷いと思っていますが)

ですが、まだやねうらおさんに対して

「Stockfish探索に変えておきながら、棋力に大した変化が無いという見通しを立てていたのはおかしい。ルールの穴をついてチートめいたことをやった悪どい奴だ」

という批判が出ているようです。

これについてはどうなのでしょうか?

4gamerで本人が語っていた?

電王戦,なんで勝てたんですか?――「ゲーマーはもっと経営者を目指すべき!」第15回は,「BM98」を開発した伝説的なプログラマー・やねうらお氏がゲスト

http://www.4gamer.net/games/001/G000183/20131222001/

先日コメントでいただいたところによりますと、

Stockfishに変更すると棋力が上がる(だろう)というのはやねうらお氏本人のブログおよび4gamersのインタビュー記事で本人が発言しています。

よって、本当にStockfishなっていたのならば指手はどうか知りませんが棋力(レーティング)は変わるというのは本人は自覚しています。

とのことです。

なので読んでみました。

今回の電王トーナメントの出場チームで,「Stockfish」を参考にしてないチームは,私のやねうら王を除いてなかったと思います。少なくとも上位8チームは,私以外の全員が参考にしていたんじゃないですか。

評価関数部分を「Bonanza」,探索部分を「Stockfish」にするだけでも,「Bonanza」そのものより一回り強くなるんですよ。

「やねうら王の探索部をStockfishに変更すると棋力があがる」という話は出ていません。

こちらは「やねうら王」についての特設サイトです。

http://yaneuraou.yaneu.com/

Bonanzaとの指し手生成速度の比較では平均して2〜3倍の速度を達成しました。

とあるように、そもそもがやねうら王はBonanzaよりもはるかに探索部が強いのです。

ではやねうら王探索とStockfish探索のどちらが強いのでしょう?

http://d.hatena.ne.jp/hiraoka64/20140317/1395072154

・やねうらおさん自身は否定していますが、私はやねうらおさんが3月1日の時点で棋力向上を認識していたことは間違いないと判断しています。

平岡さんは、結論的にはやねうら王探索よりStockfish探索の方が強いに決まっていると発言したわけです。

これの根拠が知りたいところです。

 

一方、やねうらおさんは、同じくらいだと決めつけていました。

今回の電王トーナメントの出場チームで,「Stockfish」を参考にしてないチームは,私のやねうら王を除いてなかったと思います。少なくとも上位8チームは,私以外の全員が参考にしていたんじゃないですか。

これと、電王トーナメントで4位に入賞したというのが根拠でしょう。

やねうら王の探索は、Stockfish型に匹敵する。から4位という結果になったのだと私は思います。

もし、やねうら王の探索がStockfishよりもずっと弱く、Stockfishのものに差し替えただけで棋力がアップするほどの差があるならば、なぜ4位になれたのでしょうか?

※トーナメントの当たり運が良かったとか、そういうのは対戦相手に失礼なのでやめようね

 

一方、今後のやねうら王の探索部はStockfishを基礎にしていくようです。

旧やねうら王の探索(Bonanzaの改良)と、今後のやねうら王の探索(Stockfishの改良)。

改良同士ならばきっと後者の方が強くなるのでしょうね。楽しみです。

※「3/1に渡された2/2版の新やねうら王の段階で、Stockfish改良済みだったに違いない」という指摘は水掛け論だというのもそうですが、プログラマを魔法使いか何かと勘違いしているのだと思います

 

また、このセリフを根拠にしている場合もあるようです。

http://d.hatena.ne.jp/yaneurao/20131215/p1

・Stockfishの探索部分をコンピューター将棋向きにチューンすることでまだR50ぐらい伸ばせそう。

なのでチューン型Stockfishにしていた(=旧やねうら王より棋力アップ)に違いない。というもの

Stockfishはもう以前ほど改良は進んでおらず進化のペースが落ちている。もうやり尽くされた感がある。

Stockfish探索をやねうら王に組み込んで、バグチェックもして、こんな状況のStockfishのチューンを1週間でやってしまう(想像世界の)やねうらおさんが、電王トーナメントでぶっちぎり1位になっていないのは、マジコンピュータ将棋界のミステリー。

 

他に「棋力があがっていたと認識していたに違いない」根拠があれば、コメントで指摘お願いします。

私も本人ではないので、本当はどうだったかというのは分かりません。

が、今のところあがっている根拠は、根拠とするにはおかしいと思ったので記事にしてみました。

※しっかりした根拠があれば、手のひら返します

 

それにしても、以前からやねうら王の試合だけは見ようと思っていたのに、今回の騒動で「ドワンゴに踊らされるのは嫌だなぁ」と思ってしまいました。

明日生放送どうしようかなぁ。

そしてやねうらおさんがブログ更新(追記)

http://d.hatena.ne.jp/yaneurao/20140321

忙しい時間を縫ってブログを更新されたもよう。

ほとんど私の最終推測で正解だったようです。

(決定的な違いは、明日対戦する旧やねうら王の探索部は、Bonanzaベースですらなかったというところです。が、話の流れには特に影響がない枝葉部分です)

 

プログラマ視点ではキッチリ筋の通った話になっており、嘘は感じられません。

一方、プログラマじゃなきゃ理解できない論理の流れのため、やはり非プログラマからはしばらく叩かれると思います

そもそもからして、私の推測は

・やねうらおさんが嘘つく必然性がないよなぁ

・昔からコンピュータ将棋に関わっているこの人が、電王戦のためにこんなリスキーなことするのは理屈に合わんよなぁ

理屈に合わんことをプログラマがやるわけないよなぁ

・ということは、このセリフとかこの行動はプログラマ脳的なものであって、つまりこういうことなんだろうなぁ

という、色々な前提があってたどり着けたものであり、「やねうらおって誰よ?」という大半の人達では絶対にたどり着けない推測だったろうと思いますし、つまりそりゃ炎上もするわというお話です。

amakurokouji1amakurokouji1 2014/03/22 12:12 つまりは、キチガイ脳ってことですね^^

kanokekanoke 2014/03/22 12:52 私も政治家脳や、営業脳や、自営業脳もろもろを持っていないので、それらの脳で動く人の思考を不思議に感じることが多いです。
自分が知らないことについてレッテルを張って単純化する行為は、人間としては当たり前の本能ですが、理解しようと試みるのも世界を広げる良いチャンスですよね。

NPNP 2014/03/23 04:14
 今の将棋界と棋士を支えるルールはやっぱり、人と人とを対等にそして互いの棋力をもって試合を行うことに最適化されたルールと文化の元にあると思うのです。
 言い方を変えると、互いの棋力と研究以外の外乱を極力無くすというルールの「理念や精神」が重視される文化ではないかと。
 一本の線(理念や精神)に対しての距離が重視されるイメージです。そしてのその距離感にはグラデーションや濃淡がかかっています。

 対して、自分の場合は「一定の制約下での特定の目的のための実現手段を検討・模索する」という文化で、その「制限の境界線」を確認しながら手段の取捨選択を行います。また「その制約では目的が達成することができない」場合には「制約そのものの再検討」を行う場合がありえます。

 やねうらおさんもそれなりの棋力を持つ人ですから、前者に対する理解やリスペクトは当然あると思います。しかしながら(ブログなどの発言により)本質的には後者の行動様式が働いていると理解してよいでしょう。

 ここで困るのは、往々にしてわれわれはジャッジを仰ぐ立場であるということです(要するに予算や納期を決める立場に無い)。
 そうすると我々は「ジャッジとしての役割が期待される相手」に「これはリーガル?」判断を仰ぐわけですが、そのジャッジの判断に適応した結果が将棋界側の「理念」に反するという状態になったわけです。

 「理念や精神」(あるべき論)の文化では「結果としてどうなのか?」で判断されるため、結論は出ているため求められるのはそれに対する態度なのですが…。
 自分たちのような文化の人間は大抵の場合「なぜ目的にそぐわない結果になったのか?」を分析したり説明を求められる環境に身を置いています。そのため、私たちはついうっかり「結果に対する説明をしていまう」んですよね。
 そうするとわりとよい確率で「言い訳をしやがって!」と受け取られてしまうわけです。

 じゃあ他の開発者と違って、やねうらおさんがセルフジャッジ気味だったというのはなんで?という話になるのですが、
 自分はやねうらおさんが「経営者」という別の文化もまた持ち合わせてるからじゃないかと思うのですよね。

 電王戦というのはやはり人とコンピュータという非対称的なやりとりですから、やはり既存の将棋界のルールとそぐわないところがあるはずです。だからこさまざまなバッドノウハウの検討には敏感になるべきだと思うのですが、どうもドワンゴも連盟っもそこらへんの勘所が鈍いようで。
 自分では判断できないにせよ、最低限テクニカルアドバイザーを置くなりルール講習会を開いて質疑応答で制約事項を意識共有するべきだったのではないかなー?思うのです。

NPNP 2014/03/23 04:33  そういえば、連盟側の「棋力が向上(=強くなった≠差し手がが変わった)」という判断は何をもってなされのか、佐藤六段以外の定量的な検証はあったのかはちょっと気になります。

 刺し手が変わったのはまぁ、変わるだろうということで異論は無いですが。

 事前対戦が40局程度、と言われるとその後のα版はもっと少ないだろうと思われるので、何を判断基準にしているのだろう?という興味はあります。

shiyoushiyou 2014/03/23 12:15 前記事で4亀の記事だのやね氏のブログが〜 とコメントした者です。
丁寧な解説ありがとうございます。

やね氏のブログの追加記事より
3.のやねうら王2013は、Bonanza6よりはR50-100高かったはずで(主に高速化などチューニングによる恩恵)ある。下山さんの事前情報は、1.から2.ならR100-150上がるというのだ。もし、2.のほうのトッピングが何も乗っていなければどうなのか。3.と比べるとR100上がるどころか、Rはむしろ下がるだろう。そして、実際下がっていた。それが2月2日のやねうら王2013αである。

という発言からもやはりボナンザ魔改造⇒Stockfishへ変更されていたことは間違い無いということでしょうかね。(強くなった弱くなったは別として)
また、1月中旬〜2/2まで修正を行っていたというのも少し気になります(1週間・・・なのか?)

まあ、いずれにせよプログラマーサイドの視点を持つ第三者が居なかった(本来はドワンゴの役目なのでしょうが)のは問題で、今後はコンピュータ将棋協会も交えての進行が必要になってきそうですね。
というよりも、今回の事件が起こるまではてっきりコンピュータ将棋協会も関わっているものだと思っていました。

kanokekanoke 2014/03/23 18:42 >NPさん
いやぁ、私がどう返事したら良いのか分からないです。何か主張されているようですが…。

>shiyouさん
どうも旧やねうら王の探索部は、フルスクラッチっぽい感じもしますね。
そのうち、やねうらおさんが休憩を終えてブログ再開された頃に聞いてみたいですね。

亜亜亜亜亜亜 2014/03/29 01:10 結局、まだ釈然としない部分が多いですよね。
もう将棋ソフト関係者には期待できないみたいなので、自分で分析しましたw

第3回電王戦ソフト差し替え問題に対する考察
http://hyperaaa.hatenablog.jp/entry/2014/03/29/001859

 |