2010/02/09
■[コンピュータ関連]ISSCCレポート @ PC Watch
http://pc.watch.impress.co.jp/docs/news/event/20100209_347976.html
次期Xeon/Core i7になるWestmere 6Cの他、IBMのPOWER 7とSunのRainbow Falls等の情報があります。
POWER 7だと8コア・32スレッドで4GHz、L3は32MBですし、Rainbow Fallsは16コア・128スレッドと、非常に景気の良い数字が並んでいます。
まぁ、個人で買うのはどちらもほぼ不可能なんですが、見ていて楽しいのでぜひリンク先はご一読を。
■[コンピュータ関連]ようやく出てきた次期Itanium Tukwila
http://pc.watch.impress.co.jp/docs/news/20100209_347904.html
4コア・8スレッドでTurbo Boost採用の他、QPI・DDR3メモコン統合など、次期Xeon MP(Nehalem EX)と共通の特徴もあります。
…個人的な感想は「まだ出てなかったのか」なんですが、それは言っちゃぁいけないんでしょうね、多分。
2010/02/08
紫外線
2010/02/08 23:17
我の場合は50万回ほど学習させましたが...道は遠いですね。
streakeagle
2010/02/09 17:36
そうですね、学習してると終わりが無くて大変です。頑張りましょう。
2010/02/03
■[コンピュータ将棋]Seleneさんのブログ
http://d.hatena.ne.jp/SeleneShogi/20100201
おとなり日記で気付いたのですが、選手権新規参入のSeleneさんがブログを開設されたそうです。
名前は月探査機の「かぐや」と同じみたいですね。なかなかロマンチックな名前です*1。
ソフトの作りは局面クラスが2種類あって、評価関数はボナメソで学習中らしいです。
GPS風のテンプレート使いまくった手生成ルーチンを自力で書いたらしいので、かなりのスキルの持ち主と見ました。ガクガクブルブル
■[コンピュータ関連]Core i7 970は3.2GHzの6コア?
http://nueda.main.jp/blog/archives/004849.html
価格は$562との事ですので、今のi7 950と同価格帯で出るみたいですね。
時期が今年Q3と遅いのが難点ですが、私はそれを待つ事にします。
■[開発日記]私がボナメソに手を出そうとしている理由
唐突ですが、Bonanza Methodに手を出すつもりです。
…の話の前に、まずは今後やろうとしている事から。
やる事は「プランニング」で、要するに環境のモデルを用いた学習です。モデルというのは「エージェントの行動に対して、環境からどういう反応が返ってくるかの予測」で、将棋の場合だと「ある局面での相手の指し手の予測」になります。
モデルがあると何が嬉しいかと言うと、標準的な棋士(OR ソフト)の反応が予測出来るので、それをベースにして学習し、どう指せば強くなるかが学習可能になります。
今考えているのは、Bonanza相手のローカル対局なりfloodgateでの対局なりからモデルを構築し(評価関数を学習し)、それをベースに自己対戦してさらに強い評価関数を得よう、という方法です。対局相手の知識を盗む事になって、ちとずるい気もしましたが、強くなりそうならまずはやってみようと思って実行を決断しました。
んで、そのモデルの構築ですが、まさにボナメソがその用途にピッタリ合うので、ここはひとつ使わしてもらおうかと思っています。
これで、上手く行けば囲ったりちゃんと駒を進めて攻めたりてのが出来る様にならないかと期待…してるんですが、出来るかなぁ… なんか、ヒジョーに先行き不安です。
一番の難点は、入集出来る棋譜の数が少なすぎる事なんですよね。Bonanzaの自己対戦の棋譜は2000しか手元に無いですし、floodgateでの自分の棋譜だともっと少ないです。
となるとオーバーフィッティングして変な手ばっかり指す様になりそうなのが心配なんですが、まぁやってみなきゃ分かんないんでやってみます。
かず@なのは
ガクブルです…。
読みは右上に書いてあるのにねぇ〜
streakeagle
もう、一時突破無理かも…f
あんまり読んでくれないんで、右上で自己主張してみました。
mkomiya
ついにボナメソにも手を出しますか(モデル作成として)
streakeagle
はい。と言っても、とりあえずは簡易実装で動かしてみるだけなんで、ちゃんとしたボナメソになるのはかなり先になるかと。
SeleneShogi
Seleneの作者です。ご挨拶頂きましてありがとうございました。
まだ公開してなかったはずが、「おとなり日記」というものがあるんですね(笑)
今後ともぜひぜひよろしくお願いします。
streakeagle
GA将!!!!の作者です。わざわざこっちまでおこし頂き、ありがとうございます。
私も「おとなり日記」で発見されたクチだったりします(笑)
こちらこそ、よろしくお願いしますm(_,_)m
2010/02/02
■[開発日記]棋譜からの学習を試行中
プランニングを導入するにあたり、既存の棋譜からの学習(OR floodgate等の棋譜からの学習)と自己対戦での学習のハイブリッド構成が必要になる関係で、まずは棋譜からの学習単独でのテスト。
旧バージョンにも棋譜を使って学習するルーチンはあったんですが、どうも挙動がおかしい*1ので、さくっと新規に書いてみました。
やる事は単純で、棋譜の手を指す前後に探索した評価値のTD誤差を元に学習するっていう、ただそれだけです。一応、TDLeaf(λ)っぽく、PV末端局面を使って学習しています。
使用する棋譜は、この日の為に用意していたBonanza同士の自己対戦の棋譜約2000局分があるので、それを使ってテスト。
あんまり時間が無いので、学習用マシンではアサーション無効バージョン、開発用マシンではアサーション有効バージョンを並行して走らせます。
明日には一応の結果がでるはずなので、そしたら軽くテストしてみます。
■[開発日記]危ない危ない、パラメータのセーブを忘れてた(汗
さっき作ったルーチン、学習をするだけして、アプリ終了まで一切セーブしていませんでした。
流石にそれじゃぁ実用性無いので、ちゃんとセーブするようにして一段落。
*1:終局時の評価値が1.0近くになって欲しいのに、0.2位までしか上がらない