Hatena::ブログ(Diary)

やねうらお−ノーゲーム・ノーライフ このページをアンテナに追加 RSSフィード

GT-Rの買取ならここですわ。どこよりも高く買取ってもらえるはず。お勧め!GT-R 買取
電王戦出場記念! 書籍化されたで! 監修したで!(`ω´) 絶版なってしもた Kindle版で復活!! 記事書いたで!
解析魔法少女美咲ちゃん マジカル・オープン!

YaneuLabs / やねうら王公式 / やねうらおにメール / twitter / プロフィール

 | 

2014-04-02 将棋連盟の谷川会長とドワンゴの川上会長との夢の対談が実現

[] 将棋連盟の谷川会長ドワンゴ川上会長との夢の対談が実現  将棋連盟の谷川会長とドワンゴの川上会長との夢の対談が実現を含むブックマーク  将棋連盟の谷川会長とドワンゴの川上会長との夢の対談が実現のブックマークコメント


将棋連盟の谷川会長ドワンゴ川上会長との夢の対談が実現してました!この記事、もしかしてエイプリルフール企画じゃないかと思ったら、公開日は4月2日になっていたので、エイプリルフール企画ではないようです。いやー、凄いですね。谷川会長インベーダーゲームで「100円玉がどんどんなくなっていく」ところとか想像つかないですけど、意外な一面が垣間見れて妙に親近感がわきました。


電王戦は,21世紀を生きる人類を映し出す鏡なのかも――将棋棋士谷川浩司氏がゲストの「ゲーマーもっと経営者を目指すべき!」第16回

http://www.4gamer.net/games/999/G999905/20140314022/


f:id:yaneurao:20140402074632p:image


ちなみに上記の記事中に出てくる、「人間将棋ソフトAIの一種だと考えて分類すると同型のソフトとして分類される」理論は、私の以下の記事にあります。興味のある方は、併せて御覧ください。この理論は、将棋ソフト開発者の間でも賛同してくれる人は少ないと思うのですが、人間の思考特性を考えるときにこの視点で見るといろいろ見えてくるものがあって面白いです。


電王戦に向けて

http://d.hatena.ne.jp/yaneurao/20131215#p1

ss 2014/04/02 15:26 もうご存知かもしれませんが、こちらでもやねうらおさんに
期待していると会長の声がありますよ。
森内竜王名人×川上量生特別対談
http://youtu.be/CpJ-xmhjo0U

一観戦者一観戦者 2014/04/02 16:03 人間の評価関数と聞いて思うのですが(素人考えですが…)
ある人の差し手や考え方(棋譜)をベースとした評価関数を作ると
その人に似た差し手をするソフトが作れるんでしょうかね

例えば対戦相手の研究用に、相手の思考に似たソフトが作れると
研究・対策に使えたりするのか?とか思ってみたり
(多分サンプルが少な過ぎて難しい気もしますが)

もし可能であれば、それも一つの共存の方向性の一つなのかなぁとか…

yaneuraoyaneurao 2014/04/02 17:10 ↑*2 そうですね…。やねうら王2014では本気出さないと。
↑*1
> その人に似た差し手をするソフトが作れるんでしょうかね

作れないと思います。理由はいろいろあるんですが、例えばR1500ぐらいの人の棋譜から学習させてもいまのトップレベルの将棋ソフトの探索技術だとR3000ぐらいのソフトが出来てしまいます。好みの戦型とかがいかに似ててもさすがにR1500とR3000とでは別人ですよね…。

それとは別に、ある特定の人間のプレイヤーに近い思考をする将棋ソフトというのは価値があるでしょうし、面白い研究なのですが、それは名人に勝ち越す将棋ソフトを作るより遥かに難しいでしょうね…。

亜亜亜亜亜亜 2014/04/02 19:42 >そういう意味では、npsはすごく低く、評価関数が馬鹿でかいようなソフトとして分類できるんじゃないのかなぁ…。

分類としては、その通りではないでしょうか。
ただ、上記の川上氏の発言だと、「人間の思考=精度が高い評価関数と、枝刈りに優れた探索部を持つAI」となってしまうので、もし同一視してしまうのなら、乱暴な考え方ではないかと。
ただ、やねうらさん自身は「みなせる」と述べていますので、間違いではないと思います。

あくまでも、ソフトは人間の思考を近似できる可能性がある。
しかし、それは人間の思考の一部でしかないということになると思います。
もっとも、見分けがつかないほどのAIがもし完成したら、それは人間の思考と同一かというと、そこまでいくと他我問題という、やっかいな哲学的問題になってしまいますが・・・。

観戦者n号観戦者n号 2014/04/02 19:54 川上さんが引用されているやねうらお さんの発言は、
元々森田将棋の故・森田さんが原型をおっしゃっていましたね。
もちろん、昔は「評価関数」というもの今ほどハッキリとした形では無かったと思いますが…。

「データベースに保持しているデータ量の膨大さ」
「その中から精度よく素早く正着手を探してくる力」
人間のすごさをそのように表現されていた記憶があります。

晩年の森田さんは、どのような研究をされていたのでしょうか…。

質問質問 2014/04/02 21:04 やねうらおさんはどこの大学でなにを専攻されていたのですか?
興味ありまうので、よろしくお願いします。
息子にも勧めようかなと思います。

YakitoriYakitori 2014/04/03 03:13 人間はデータの持ち方がすでに最適化されてるんじゃないですかね。
データ構造とアルゴリズムのデータ構造の方です。
まずカテゴリーをブーリアンで枝刈りしてネストしてエレメントをブーリアンで枝刈りしてネストして3個位になるまでやって、それを返すオブジェクトっていうのが存在するような気がします。
そこら辺が検索部で思考部はまた違うパラメータで否定したりするんじゃないでしょうか。思考部はリアルタイムの知識がものをイイますからそういう評価を加味するようになってる気がします。
まぁ、自分をかえりみての話なのでおかしなこと言ってるかもですが。
ところで、インタープリタとトランスコーダの関係って面白いと思いませんか?

かえさるかえさる 2014/04/03 04:12 人間の指し手生成アルゴリズムは、明らかにコンピュータ将棋とは違いますよね。人間は静止局面から数手の候補手を生成し、熟考して最終候補手を決定しているようですね。理研と将棋連盟の研究報告で、森内・渡辺両先生がその辺りについて語られています。
http://youtu.be/ThuhwmK7FJM

この様に直感で最終候補手を選ぶ事実はチェスでも古くから研究報告があるようなので、脳のゲームへの最適化はパターン化されているのかもしれませんね。
http://youtu.be/dDvXkU1IGK8?t=3m48s - 理研と将棋連盟の研究報告
http://en.wikipedia.org/wiki/Adriaan_de_Groot
https://chessprogramming.wikispaces.com/Adriaan+de+Groot
指し手生成関数は、ハード(脳神経NW)に依存しているのかもしれません。この辺の研究があれば読みたいものです。

一つ気になるのが、羽生先生の存在です。
何かが違う気がするのですが、これは研究者に頑張ってもらうしか無いですね。

yaneuraoyaneurao 2014/04/03 10:29 ↑*3
> やねうらおさんはどこの大学でなにを専攻されていたのですか?

大学のときはそれを最小の出席時間で卒業するゲームだと思っていて、ほとんど大学の授業には出てなかったので、全くお手本からは外れている学生だったかと思います。ですので参考にはされないほうがよろしいかと。授業には出ない代わりに毎日図書館で読書するのだけが唯一の楽しみでした。

↑*1 こういう研究はとても面白そうですね。

HAMUNZAHAMUNZA 2014/04/03 23:41 炎上の件からやねうらおさんのブログを拝見させていただきましたが、面白い発想が多く軽めのファンになりそうです(笑

柔軟過ぎる考え方、参考にさせていただきます。

いりおもていりおもて 2014/04/05 00:01 4gamerの記事読みました。

人間 対 コンピューターという構図に社長がこだわるのはどうかと思いますが、アドバンスドチェスみたいにどんどん人間がコンピューターを利用して強くなると言うのが行き着くところだと思います。

自動車や飛行機が出来てから人の行動範囲は広がりましたし、コンピュータが発展するにつれ人類の活躍範囲も広がると思います。

ただ、利益を得るのはコンピューターをより活用できる人に限りますので、結局のところ、教育問題や貧困問題がクローズアップされるのかもしれません。

逆にそういう諸問題もコンピューターの進歩で解決できるかもしれませんが、どうなんでしょうねぇ。50年後、コンピューターやロボット等で食糧や教育問題が無くなったとして、、、その時人類に残された問題って何でしょうね?

り 2014/04/05 08:24 今年の世界コンピュータ将棋のアピール文書とか公開されてますが、やねうらおさんが「これは注目だ」というアピール文書はありますか?

前から思っているのですが前から思っているのですが 2014/04/05 13:01 局面と言う多次元のベクトルを一次元の数直線上に射影する関数を一般的に評価関数と呼ばれているように思いますが、そもそも局面自体の順序を決定する比較演算子があればMin-Maxに基いた探査はできますよね?そういった評価関数を持ってなくて比較演算子を持ってるソフトってあるんですか?(それとも、昔はあったが淘汰されたのか)

SVMとかNNの研究結果をそのまま使えそう&オンライン学習向き?のような気がするんですけど、置換表が役に立ちそうにないのでその辺のデメリットの方が大きいのでしょうか?

aa 2014/04/05 14:12 その比較演算子が結局は評価関数なんじゃないですか?

観戦者n号観戦者n号 2014/04/05 15:30 >かえさる さん
私見ですが、人間の判断はパターン認識に還元されると思っています。
「検索木を早い段階でバッサリ切って精度を上げる」、その代わり「初歩的な見落としもある」のが人間の検索ではないかと。

かつ、人間の検索は「経験した時の感情に結び付いている」とも思うんですね。
「気持ちよかった」「辛かった」
「嬉しかった」「悔しかった」
人間検索のオーダリングは「記憶時と結びついた感情である」というのが私の仮説です。
だから飛びぬけて素早く正確な応答を返す可能性もある反面、とんでもなく変な応答をすることもある、と。

パターン認識は、「電波伝送中に『なまった』デジタル波形を復元する技術」と密接に結びついているそうです。
私は専門家ではないので全く分かりませんが、やねうらお さんは、あらゆる意味で人間を凌駕する思考エンジンを構想しているのではないかと考えています。

yaneuraoyaneurao 2014/04/05 16:11 ↑*3
> そういった評価関数を持ってなくて比較演算子を持ってるソフトってあるんですか?(それとも、昔はあったが淘汰されたのか)

昔からいまに到るまでないと思います。理由は、局面の優劣の比較は特定の局面(駒が一方的に損しているとか手損しているとか)を除くと極めて難しくて現在のコンピューター将棋の技術では設計できませんし、仮に出来たとしても比較操作自体がすごく計算コストのかかる処理になります。

評価関数で1つの数値に射影して、その数値を比較するほうが実装が簡単で、かつ現実的な実装が出来ます。あと、評価関数で1つの数値に射影するのが将棋においてはそこそこ妥当性があるのです。理由は長くなるので割愛しますが、「将棋方程式」でググると私が昔に書き散らした文章が出てくるのでそのへんを参考に…。

aa 2014/04/05 16:55 人間をAIの一種として分類するときには、探索と評価関数は分けて考えたほうが良さそうですね。

その2つとも関わることですが、人間の演算能力が低いというのはどうかなと考えています。人間の神経細胞は全体で2000億、大脳でも150億のオーダーがあり、神経細胞1つあたりにシナプスがラフに1000個あります。

その各々で20Hz程度で記憶と演算が行われています。人間の脳がpeta flops級の演算能力があるという話はこういった背景があるのだと思います。

単純な掛け算は問題解決におけるアルゴリズムも演算自体の精度も違うでしょうし眉唾ですが、いずれにせよ現在のPCよりも何桁も演算能力は上でしょう。

これまで広義のAIなりロボットなどの自動制御が不可能であったのはソフトウエアが未発達だっただけではなく、ハードウエアの演算能力の面でも絶対的に足りなかった面があるはずです。(両者は不可分ですが)

いわゆる人間の演算能力が低いというのは、短期記憶容量の限度と整数演算的なシリアルなものの速度と正確性に由来するものだと思います。

その意味で人間の評価関数は並列的で浮動小数点的なパラメータ数の規模が違う重量級のものであってそれが質という形で現れているのではないでしょうか。

その意味で、電王戦のPCでそれなりに強力なGPUが遊んでいるのは非常にもったいない。将棋AIの飛躍のブレイクスルーはhokiさんの棋譜からの表価関数出力でしたが、次はnpsはある程度犠牲にしても評価関数の浮動小数点化とそれによる精密化だったら面白いと思っています。

yaneuraoyaneurao 2014/04/05 18:56 ↑はい、そうですね。おおむね同意します。しかし、逆に、peta flops級の演算能力があるのにたかだか数桁の掛け算すらほとんどの人は暗算で出来ないところがまた不思議なんですよね。神秘的ですらあります。

aa 2014/04/05 19:12 不思議で神秘的ですよね。
個人的には2桁×2桁ですら即答は無理ですw

それだけ問題解決の仕方が違うということで、広域かつ高度に分散した結果をまとめるのが苦手な構造なのかもしれません。上の方の書込みでもあったパターン認識はその構造に上手くあった問題の可能性があります。

まったく異なった両者を上手くエミュレートする方法論がみつかれば将棋AIを超えた応用がありそうで楽しみです。

興味がわいた。興味がわいた。 2014/04/05 20:30 ↑*4

>>昔からいまに到るまでないと思います。理由は、局面の優劣の比較は特定の局面(駒が一方的に損しているとか手損しているとか)を除くと極めて難しくて現在のコンピューター将棋の技術では設計できません

2つの局面入力として持つ分類器(比較演算子)として考えれば、典型的なSVMやNNの問題に帰着するわけじゃないですか。数値に射影した結果に対して、指し手の一致度を上げる最適化よりも、収束が速い気がするんですけどね。局面の集合が完全な全順序を持つ必要が無くなるので、矛盾を学習させるのが簡単そうに思ったんですけど(逆に問題になる可能性が大きいのかな)。

まぁ、置換表が使えないのが致命的に思えますけどね。面白いことやってるなと思わせるソフトは作れそうですね。

aa 2014/04/05 21:04 SVM等で2値に分類したとしてどちらも1の場合は?優劣を決める比較演算子なら全順序になるのだろうし…理解してない?

これ以上は記事に関係ないのでこれ以上は記事に関係ないので 2014/04/05 22:20 >>SVM等で2値に分類したとしてどちらも1の場合は?
だったらそれで、いいじゃないってこと。評価値の自体が矛盾だらけなんだから(3駒配置でさえ矛盾だらけなのは、NDFの例から明らか)

局面の集合に、定義した比較演算子に対して全順序が無くても探索自体が無限ループすることは普通はありませんし。まぁ、自然と乱択性が生まれるので面白いかと。

>>優劣を決める比較演算子なら全順序になるのだろうし
A>BかつB>CならばA>Cが常に成り立つから全順序なんだから、比較が出来ることから全順序が存在することは導けないのは明らか。

り 2014/04/06 09:16 興味深い話をされていますね
将棋の全局面数は10の226乗レベルです。
プロ棋士が7万局の棋譜を残したとして、それぞれ150手で試合が終わったとすると出現している局面数は1千万レベルです。

aa 2014/04/06 21:08 確かに記事に関係ないのでこれまで最後にしておきましょう。

推移律さえ仮定しない大雑把に二分するだけの比較演算子では駒得評価関数以下です。乱択性はありますが、それでは意味がない。

一方的に言われるのは癪なので一方的に言われるのは癪なので 2014/04/10 21:40 >>推移律さえ仮定しない大雑把に二分するだけの比較演算子
そんなこと一言も言ってないよ。棋譜の学習は局面間での推移関係を仮定して学習するんだから、探索が必要な部分では理想的に動作しないとおかしい(動作しないのであれば、SVMなりNNの選んだモデルの関数近似性能が悪い(もしくは収束が遅い)という結論になる)。

私が言っているのは比較演算子そのものを近似する場合は、対局で現れそうにない未知の局面や比較対象に成り難い掛け離れた局面との間で、必ずしも推移律が成立する必要はないのではないかと言っているだけです。そして、ボナメソ自体が一種のSVMとして定義できるのだから、SVMなりNNで局面の比較自体を行う比較器を狙い撃ちしてもそこまで悪い結果が出るようには思えないという主張です。

まぁ、良い結果が出るとも思えないという意見もあると思いますが、誰もしてないならやってみたいなと思ったんですよ。直交学習しやすいので選択するモデル(たとえば、DeepLearning+線形SVMなど)によっては学習容量を大きくできるのではないかと思っています。

もちろん、局面比較の回数は、一般的な評価関数の呼び出しの回数の比ではないことは理解してますが、並列化との相性は良いと思います(クイックソートみたいなものだと思うので)。

yaneuraoyaneurao 2014/04/10 21:48 ↑どこかブログ作ってもらって、そこで研究の内容とか公開してもらえたら愛読させていただきます。

トラックバック - http://d.hatena.ne.jp/yaneurao/20140402
 | 

1900 | 01 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2013 | 01 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2014 | 01 | 02 | 03 | 04 | 06 | 08 | 10 | 11 | 12 |
2015 | 01 | 02 |


Microsoft MVP
Microsoft MVP Visual C# 2006.07-2011.06