アンカテ このページをアンテナに追加 RSSフィード

2016-10-29

将棋のソフト指しに見る逆転の構図

(2017/01/03 追記)

この記事内の不正の有無に関する見解について私は後日考えを変えました。詳しくは下記の記事を参照ください。

(追記終わり)


最近、将棋観戦してて、解説者が変に弱気になっていると感じることがよくあります。

昔から、解説の棋士は、対局者より上位の人でも「これが正解の手で、はたして彼はこれを見つけられるか」というような解説はしませんでした。全身全霊をかけて盤の前で真剣に対局している人には、解説者は一定の敬意を持っていました。解説者は、聞き手の人に冗談を言ったり視聴者向けに基本の手筋を説明したりして、番組を成立させる片手間で読んでいるのですから、対局者より多少棋力が上でも、「正解を知っているのは対局者二人」というスタンスで解説してました。

だから、「ここではAかBしかない」と言って、指されたのがCであっても、別に解説者がうろたえたり謝ったりすることはなくて、平然と「ああここでCですか。いや、これはいい手ですね」と言っていました。

しかし、今は、「ここではAかBしかない」と言いたいけど言わずに微妙にごまかしているような解説が多い。特にニコニコ動画だと「〜としか思えないですが、どうですかね」とか言ってコメントを見ている。あるいは控室の検討の様子を気にしている。

おそらく、ソフトの検討結果を気にしているのだと思います。

「ここではAかBしかない」と断言してしまって、ソフトがCを表示していたら困りますからね。気持ちはわかります。

これを見てて思ったのですが、昔は、対局者>解説者>視聴者だったのですが、今は、この力関係が逆転しています。ソフトを自由に見れる視聴者が一番上で、控室の検討やコメントを通じて、部分的、間接的にソフトを参照できる解説者がその次、そして、一切ソフトと遮断されている対局者が一番下です。

今は、対局者<解説者<視聴者なのです。

解説者は、(ソフト情報が断片的に伝わってくる状況にある)自分の読みが対局者に劣ることは心配してなくて、ソフトべったりの視聴者から見て的はずれなことを言ってないかを気にしているのです。

性善説に基くあいまいなルールが時代遅れ」というのはちょっと違いますね。今までは対局者が最強だったので保護する必要がなかった。タイトル戦で真剣に対局している人に助言できる人なんて世界中のどこにもいなったのです。

必要なルールとは、アマの大会でプロが助言しない、プロの対局でも下位の棋士の対戦では、上位の棋士が助言してはいけないというようなルールです。これは性善説で充分だったのです。「名人が助言したら対局が成立しません。でもそんなことあえて言わなくても名人はわかってますよね」ということです。

プロがアマの対局中に助言したらアマの大会が成立しません。いわば、プロは猛獣でその猛獣を檻の中に閉じこめて、弱いアマを保護する必要があった。プロでも下位の人は上位の人、名人や竜王という猛獣から保護する必要があった。

名人を囲う檻は、名人という猛獣が外で暴れないための檻だったのですが、今はそれが、名人という壊れ物を外界から保護する檻になっているのです。

対局者が不正をするしないではなくて、第三者がソフトの読みを無理矢理に教えることで対局を壊してしまうことができるのです。

竜王戦の会場に街宣車でおしかけて「6三歩成」とか「3二飛成」とか大音量のスピーカーでソフトの読んだ手を怒鳴るとか。街宣車では騒音による業務妨害になりますが、ドローンで敷地外から掲示したらどうなんでしょうね。

たぶん、悪意を持って手を見せようとすること自体が業務妨害になると思いますが、こういう種類の妨害は竜王が最強の時代にはあり得なかったことです。

渡辺竜王は、「竜王という権威が保護すべき最弱の存在であってそれでもなおかつ大事なものである」ということを誰よりも理解し受けいれるリアリストなのだと思います。

最弱の権威にとっては、疑いが確定してなくてグレーであっても致命的なものとして対応しなくてはいけない、ということです。

これは、「炭鉱のカナリヤ」としてとらえるべき問題だと思います。

ソフトの評価関数は相対的なもので、精密で正確にはなっても、名人や竜王の代わりにはならない。手の意味や価値はやはり相対性の中にはないと私は思うのです。

ヴァイラルメディアも、そのうちゴシップ記事だけではなく、客観性やファクトを含んだ評価関数を手に入れて信頼性の高い記事をピックアップし自動生成するようになると思います。社会を形作っているあらゆる権威が、これから似たような形で相対性の中に埋もれていくでしょう。

相対性が正確であるというだけで、人を排除していいものなのか。でも、人が運営するメディアは、間違いや偏りや思いこみだらけで、それが数値として誰の目にも見えるようになります。

その両面をリアリズムでとらえないと、何か大事なものが絶滅してしまいます。そして、その変わり目は急激に起こるのです。

将棋の評価関数は、人間よりはるかに劣っていたし、今もそうです。でも、将棋ソフトは人間よりはるかに深く読めるので、人間のレベルでなくてもいいのです。ちょっとした評価関数の改良が結果を飛躍的に改善するのです。ボブサップはチャンピオンになれなかったけど、多少マシな寝技のできるセームシュルトは強すぎてK1をつまらなくしてしまいました。両者のテクニックの違いのようなものです。

人間の頭脳とコンピュータを体格差にしたら、サップやシュルトなんてもんではなくて、負けても勝負になってるだけで、プロ棋士というのは本当に凄いものだと思います。

ただ、体格のいい人が、どの程度、ボクシングテクニックや寝技を見につけたら最強になるのか、その境目はなかなかわからないものです。 将棋ソフトも、数百台のクラスタならプロより強いと言われて、二年でそれより強いスマホのアプリが出てきました。ボナンザ〜GPSクラスタ〜技巧という技術の進展は急激ですが連続的、漸進的なものでした。

ニコニコ動画の将棋中継画面は、将来の何かを見事に象徴しています。古い権威が相対性の評価値を示すバーで囲われていて、我々はそのバーの上がり具合で枠の中にいる人を「すごい」と言っているのです。

枠の中にいる人は、その評価値を単なる余興としか思ってなくて、実際、ある時までそれは冗談にしかならない、とてもいい加減な数値なのですが、ある日突然、その数値が正確になって上下関係が逆転してしまうのです。評価値だけを見て枠の中を見ない人と、評価値を無視して枠の中だけを見る人がおたがいを馬鹿にする不毛な論争をし続けていて、両方を見るリアリストがほとんどいない。

fbird3fbird3 2016/10/30 15:30 おもしろい

BigHopeClasicBigHopeClasic 2016/10/31 22:25 拝読しました、ありがとうございます。

> 将棋の評価関数は、人間よりはるかに劣っていたし、今もそうです。

評価関数と探索の二大要素の関係をどう捉えるかは難しいところで、初形から100手先まで完全に探索できれば評価関数はごく簡単なものでいいし、評価関数が完璧なら探索は要らない、というのが究極とすると、3年前までは「評価関数磨くよりも探索だよね、計算機の数をカネで買えば勝てるよね」だったのが、その後急速に評価関数側にシフトして、昨年から今年にかけての1年間の潮流は「探索はチェスソフトの猿真似でOK、評価関数を軽自動車買えるカネでブラッシュアップさせよう」でした。
結果として、現在は評価関数の出来が恐ろしく向上して、今年の年明けくらいの段階では「aperyの評価には違和感がある」と言っていた渡辺竜王が、春に技巧が出てからはもうそんなことは言わなくなっています。

むしろ今のコンピュータ将棋の弱点は(相対的に)探索の方になって(探索も進歩はしているけれど評価関数側ほど劇的に進歩していない、という程度の意味で)、aperyが1年間でponanzaとの差をぐんと縮めたけどまだその差が大きくて、そこは多分探索だろう、たぶんチェスソフトの猿真似だと(チェスソフトの探索が猿真似で将棋に使うだけでも極めて優秀であるにもかかわらず)将棋ではそれでは足りない、特にコンピュータ将棋が強いと一般には無条件で信じられ誤解されている終盤において(あくまでも相対的にですが)弱い、というのが現下の状況ですね。

essaessa 2016/11/01 09:31 説明が足りなかったかもしれませんが、私は、探索を全くしない一局面の静的な評価をする部分を指して評価関数と言っています。
ユーザに見えるのは、評価関数そのものではなくて、浅い探索を行った後の評価値だと理解しています。
ソフトの評価関数の精度がボナンザ以降も相当向上しているのはまちがいなくて、それが(浅い探索を含む)評価値の精度にあらわていると思います。
ただ、読みを一切しないで盤面そのものから勝敗につながるポイントを瞬間的に読み取るプロ棋士の能力は、(原義的な意味の)評価関数よりかなり上だと思います。
もし、そうでなかったら、探索(読み)における圧倒的なハードウエアの速度の差が強弱に直結してしまうので、実力差はもっと大きくなるのではないでしょうか。

はてなユーザーのみコメントできます。はてなへログインもしくは新規登録をおこなってください。

トラックバック - http://d.hatena.ne.jp/essa/20161029/p1