今週末はデータの分析をしながらマッタリ過ごす予定 RSSフィード

2011/10/27

[][]ひよこカルロ将棋さん結構強い 16:30

 GA将!!!!!と当たったんですが、序盤からちゃんと指してます。モンテカルロ木探索木探索無しのモンテカルロでしかもできたばっかって事を考えると、かなりレベル高いですね。

 http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2F2011%2F10%2F27%2Fwdoor%2Bfloodgate-900-0%2BGasyou_Atom-D510_2c4t%2Bhiyoko_carlo_v0.05%2B20111027160002.csa&go_last=on&move_to=71

 GA将!!!!!の方は71手目で5九金打とかしちゃって、持ち駒を無駄に使ってます(ここは5八金左でも良かったのでは?)。こういう変な癖は修正しないとマズイですね。

 その後は75手目4五香から強引に攻め込んで、何とか勝てましたv

 とりあえず、今後の学習は序盤〜中盤が重要ですね。

[]とりあえずカーネル法 21:00

 

カーネル法によるパターン解析

カーネル法によるパターン解析

 この本を図書館で取り寄せ頼んできました。¥7,140なので、いきなり買ってカーネル法が使えなかったら困るので。

 届くまで最長1ヶ月かかるらしいんで、その間に自然方策勾配法の勉強しておきます。

[][]相変わらずひどいなぁ 23:37

 http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2F2011%2F10%2F27%2Fwdoor%2Bfloodgate-900-0%2Blesserpyon_sakura_vps_test%2BGasyou_Atom-D510_2c4t%2B20111027230006.csa&go_last=on&move_to=64

 金銀3枚使ってれさぴょんの龍をいじめに行ってるし、その後飛車を敵陣に打ち込んであっさり取られるし。

 まぁ、勝ったから良しとしますか。

[]強化学習カーネル法 00:09

強化学習における価値関数の学習でもガウスカーネル関数がよく用いられるが,この場合でも事前知識を用いることにより,更に良いカーネル関数を構成することができる.

http://sugiyama-www.cs.titech.ac.jp/~sugi/research-jp.html#theory-similarity-learning-kernelization

 ふむふむ、強化学習カーネル法の組み合わせが可能ってのは嬉しい情報ですね。前例があると色々やりやすいですし。

 

 杉山将さんってどっかで聞いた事ある名前だと思ったら、この前買った本の著者の一人だった。

[]線形評価関数+強化学習+カーネル法、行けるかも 01:04

 カーネル法による構造データマイニングって論文(2ページ目)にカーネル関数の使い方が載ってますが、これを読む限りでは表題の組み合わせ、行けそうです。

 TD法ならほぼ確実に、方策勾配法でも多分OK。

 上手く行けば「化ける」可能性あるし、ここはいっちょ気合入れてやってみますか。

[]AMD FX-8150の発売日と価格 01:11

 http://www.gdm.or.jp/voices_html/201110/27a.html

 水冷モデルが11/04で¥34,000、空冷モデルが11/11で¥25,000弱らしいです。

 8コアモデルとして見るとイマイチな性能ですが、「4コアで2wayのマルチスレッディング可能なCPU」と考えれば、まぁ悪くない価格と性能だと思います。

 ただ、実際に発売されるまで予断を許さない状況ですし、例によって出る出る詐欺かもしれませんから、噂程度に聞いておきましょう。

usapyonusapyon 2011/10/27 21:22 いや、ちゃんとひよこ将棋さんのブログを見るとある意味、もっと衝撃の事実が…。

> ちなみにひよこカルロ将棋は、mcts(モンテカルロ型木探索)は使っていません。あくまでモンテカルロ法です。

MCTSも使っていない(『単純』モンテカルロ法ではない…UCB1は使っているので)モンテカルロ法のプログラムに「れさぴょん」が負けている…OTL
 <いや、自分で常駐させているわけではないので、「れさぴょん」の実力は良く分かりませんが。

しかし、自分で常駐させていた「うさぴょん」の最高Rも多分負けているので…ますますOTL

GasyouGasyou 2011/10/27 21:30 あ、本当ですね。UCB1を使ったのはv0.03からと書いてありました。

私もあっさり抜かれそうで、内心ドキドキしています。と言うか、R的にはもうほとんど互角ですね _| ̄|○

れさぴょんはうさ親さんが参戦させてるのかと思ってたのですが、違ったんですね。
てっきり、開発中のバージョンかと思っていました。

GasyouGasyou 2011/10/27 21:31 …って、あれ?
>モンテカルロシミュレーションにUCB1を採用しました。
とあるので、ルートノードでUCB1使ってるだけで、UCTは採用してないんでしょうかね?
ますます_| ̄|○です…

usapyonusapyon 2011/10/27 21:41 そうなんです。UCTは使っていなくて、ルートノードでUCB1を使っているだけみたいです…。

usapyonusapyon 2011/10/27 21:48 れさぴょん系は、自分でも過去に参加させていたことがあるのですが…
最近はマシンと安定したネットワーク環境が確保出来ないので、私の方では主系列の「うさぴょん」すら参加させていませんです。

それと、「うさぴょん」の常駐には未だにフィックスしていないバグがありまして、千日手になった後や、abnormal endしてしまった後に、手動で再開させないとダメなんですよね…。

「れさぴょん」を常駐させている方は、その辺、どうされているのかなぁ…。
「れさ改(将棋所に付属のモノ=れさぴょん+USI+うさぴょんの公開定跡)」+将棋所、なのかな?

GasyouGasyou 2011/10/27 21:56 >ルートノードでUCB1を使っているだけみたいです…。
という事は、まだ伸びしろがあるって事ですよね ガクガクブルブル

>千日手になった後や、abnormal endしてしまった後に、手動で再開させないとダメなんですよね…。
なるほど、それは大変そうですね。
私は通信関係は将棋所にお任せしてるので、その辺りは楽でした。
ただ、自宅のルータに問題があって、時々瞬断が起きるんですよね。
なので、floodgate用マシンだけはルータの外に繋いでたりします。

>「れさ改(将棋所に付属のモノ=れさぴょん+USI+うさぴょんの公開定跡)」+将棋所、なのかな?
さくらVPSのOSはLinux/FreeBSDみたいですし、Linuxで動作実績のある将棋所って可能性は高そうですね。

れさぴょん常駐の人れさぴょん常駐の人 2011/10/27 23:15 れさぴょんをさくらで動かしているものです。勝手に動かしてすいません。

Linux上で動かしていてshell scriptにて毎時29分と59分に自動ログインするようにしています。常駐するといろいろ問題あるため一戦ごとに抜けています。

さくらのvps(980円/月コース)のCPUはCore2Duo T7700@2.40GHzでして、あんまり速くありません。bogomipsが5320.37。素のれさぴょん(+gcc)だと5-6手ぐらいしか読めません。今はあちこち書き換え+iccで7-8手ぐらい読んでますが、ひよこ将棋に比べて絶対的に読みの深さが足りないんで、負けるのも致し方なしというところです。

高速化パッチを還元できるといいんですが、かなりいじってしまったんでどうしたもんかと。Teを構造体から64bit変数にしたりしてるんで...

GasyouGasyou 2011/10/27 23:33 はじめまして。よろしくお願いします。

>shell scriptにて毎時29分と59分に自動ログインするようにしています。
その方法だと、プロセスも毎回再起動出来ますしバグの発生頻度が低くなりそうでいいですね。
(もっとも、長時間動かさないと発生しないバグの発見が遅れそうではありますが。)

さくらVPSって結構ハイスペックなんですね。てっきりAtomかと思ってました。
個人的には、高速化とか改良したのなら名前変えた方が良いかとも思うんですけど、外野が口出すのも野暮ですかね。

>Teを構造体から64bit変数にしたりしてるんで...
Teは構造体のまま、メンバ変数を64bit一個にして、メンバ関数等のインタフェースをオリジナルのTeと互換性ある形にすれば扱いやすいのではないでしょうか。

れさぴょん常駐の人れさぴょん常駐の人 2011/10/27 23:41 >さくらVPSって結構ハイスペックなんですね。てっきりAtomかと思ってました。

共用なので丸々速度が出ているか謎なのと、メモリが512MBしかないのがネックです。
980円なのであまり贅沢は言えません。

>個人的には、高速化とか改良したのなら名前変えた方が良いかとも思うんですけど、外野が口出すのも野暮ですかね。

変えたほうがいいかなと悩んでるところでした。sakurapyonとかがいいかな。

GasyouGasyou 2011/10/27 23:49 あー、共用だから他に負荷かけてる人がいると速度落ちるんですよね。
2コアで512MBだと確かにちとつらそうですが、メモリ増やすと値段が高くなるので維持が大変ですよね。
それに、初期費用+12ヶ月分の料金で、ローエンドPCが買えそうです。

速くなってるなら「シャア専用うさぴょん」とか「RedLesserpyon」とか…って、これはネタが通じる人が少ないかもしれませんね。

れさぴょん常駐の人れさぴょん常駐の人 2011/10/28 00:01 月額費用は電気代かからないことを考えれば安いと思ってます。
Atom PCで30Wでも24時間稼動の場合は月に500円ぐらいになりませんか?

// しかも、このサーバーはコンピュータ将棋用でもなく、れさぴょんはおまけに動かしてるんで

GasyouGasyou 2011/10/28 00:13 30Wのマシンで電気代が24円/kWhとすると、確かに500円位になりますね。
そう考えると、Core 2 Duoマシンが月980円ってのは格段に安いですね。

// なるほど、そういう事情なら更にお得ですね。

usapyonusapyon 2011/10/28 02:12 >れさぴょん常駐の人
はじめまして、最初にれさぴょんを作った人…です。
有効活用(?)されていて嬉しいです。

>高速化パッチを還元できるといいんですが
前後の文章を読ませて頂きましたが、『還元』は難しそう…ですねぇ…。
いっそのこと、どこかでソース公開…?
 <差し支えなければ、もしも送って頂ければこちらで勝手に公開してもいいのですが(苦笑)。

さて、電気代の話…ですが、実は私が現在常駐していない理由の一つにそれがあったりします。
#常駐させると、一ヶ月に\8,000位電気代が違うOTL

あー…。
そうだ、gccで動かすと、gccのバージョンにもよるんですが、実は素のれさぴょんは、rand関数の戻り値が15bitしか帰って来ないことを期待した作りになってるんで、ハッシュ関係の動作がどうなの?とか、れさぴょんサポート掲示板で既に提案していただいた、詰め将棋関連のバグフィックスとか(秀逸なパッチがユーザ様から提供されました)…。
何か色々気になるところが…。

で。名前は別に気にしないで下さい。
個人的には、実は「何かえらく深く読めるれさぴょんだなー」とか感心していましたが、高速化で工夫されているようで、納得です。


上記と絡んで、全然話は変わりますが、何かの方法で、floodgate上で自分のWebページ(プログラム紹介とか、ブログとか)へのリンクが出せるといいですね。
そうすると、例えば「あぁ、lesserpyon_sakura_vps_testってこういうプログラムなんだなぁ」とか理解しやすくなって幸せな気がします。

れさぴょん常駐の人れさぴょん常駐の人 2011/10/28 05:25 >はじめまして、最初にれさぴょんを作った人…です。
>有効活用(?)されていて嬉しいです。

お世話になっております。はじめまして…ではなくて一度チャットしたことがあります。
おかげさまで、れさぴょんと楽しく遊んでます。bonanzaは難しくて。

> 前後の文章を読ませて頂きましたが、『還元』は難しそう…ですねぇ…。
> いっそのこと、どこかでソース公開…?
> <差し支えなければ、もしも送って頂ければこちらで勝手に公開してもいいのですが(苦笑)。

現在のソースはかなり汚いんで、公開は少し綺麗な体になってからお願いします。
うさ親さんが興味がありましたら、ソース自体はいつでも送付します。

> そうだ、gccで動かすと、gccのバージョンにもよるんですが、実は素のれさぴょんは、rand関数の戻り値が15bitしか帰って来ないことを期待した作りになってるんで、ハッシュ関係の動作がどうなの?とか、

これは気づきませんでした。

> 上記と絡んで、全然話は変わりますが、何かの方法で、floodgate上で自分のWebページ(プログラム紹介とか、ブログとか)へのリンクが出せるといいですね。

短縮URLにして、それをプログラム名にするとか(笑)

GasyouGasyou 2011/10/28 06:17 >> 上記と絡んで、全然話は変わりますが、何かの方法で、floodgate上で自分のWebページ(プログラム紹介とか、ブログとか)へのリンクが出せるといいですね。
>
>短縮URLにして、それをプログラム名にするとか(笑)

ランキングのページがカオスな事になりそうですねw

真っ当にやるならログイン名・トリップとURLを入力する画面を新規に作って、そこから登録って流れでしょうが、イマイチ面白みに欠けますね。
ついでに工数も結構掛かりそうですし…

usapyonusapyon 2011/10/28 20:47 >れさぴょん常駐の人、様
れさぴょんサポート掲示板への最新の投稿で、diffの比較対象がsakurapyonとなっていた+その投稿者のIDと、「一度チャットしたことがあります」でピンと来ました。

…間違っていたらごめんなさい、なのですが、将棋倶楽部24上でチャット(感想戦?)をさせて頂いた方でしょうか。
あの時のチャット(感想戦?)のログは、自宅PCに、テキストファイルとして大切に保管しております…(今は仕事先なので、読めませんが)。
 <未だにあの時に語った目標を全然達成していないのがアレなのですが…OTL
 <いつも棒銀で攻めてくるCPUとかあったらいいよねー的な話もしたはず。
  <記憶違いだったらごめんなさい…。

いつか目標達成します(苦笑)。

れさぴょん常駐の人れさぴょん常駐の人 2011/10/29 18:25 バレバレだったですね(^_^;

目標達成応援しておりますです。