Hatena::ブログ(Diary)

極めて個人的なメモ Twitter

Θ・)ノシ Bob#3のメモ帳です。
1972 | 12 |
2003 | 03 | 04 | 05 | 06 | 11 | 12 |
2004 | 01 | 02 | 03 | 04 | 05 | 06 | 09 | 10 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 09 | 10 | 11 |
2006 | 03 | 04 | 05 | 06 | 07 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 05 | 06 | 07 | 10 | 11 | 12 |
2008 | 01 | 02 | 04 | 05 | 08 | 09 | 10 | 11 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 |
2011 | 05 | 06 | 09 | 10 |
2012 | 02 | 03 | 05 | 06 | 08 |
2013 | 01 | 02 | 03 |
2015 | 02 |

2006-12-09

ユーザーRユーザー会を含むブックマーク Rユーザー会のブックマークコメント

Rユーザー会に行ってきました。

会場は広尾の統計数理研究所

赤池情報規準(AIC)で有名な赤池さんが所長を務めていらっしゃったところですね。

外国の大使館が立ち並ぶ上品で落ち着いた街の中に統計数理研究所の建物はありました。

開始時間の9時半で参加者はざっと40〜50名程度だったと思います。

SASSPSS、S-plusのユーザー会とは比べるべくもありませんが、手作り感に溢れて良い雰囲気でした。

09:30-10:15「データハンドリングデータフレーム 30 分クッキング〜」

まずは「The R Tips」の著者である舟尾さんの発表。

 を使う上で基本中の基本となるデータフレームの扱い方についてのお話。

 私の場合はもっぱらExcelからCSVかタブ区切りのテキストに落として、Rcmdrを使うか、read.csvやread.delimで読み込むんですが、他にもいろいろ便利な方法があるようです。

 他にもデータフレームの様々なハンドリング方法が紹介されていました。

 データ量が多いときはこれらの方法を使いこなせると便利そうです。

The R Tips―データ解析環境Rの基本技・グラフィックス活用集

The R Tips―データ解析環境Rの基本技・グラフィックス活用集


10:15-11:00「MCMC 計算まわりでさまよう R ユーザー

ズボンインがおされな久保さんの発表。

やっぱりベイズ統計は勉強しておかなきゃダメだなぁ、と思いました。


11:00-11:45「R起業フリーソフトウェアデータ分析ビジネスの現在」

個人的に一番興味深かったのが株式会社ef-prime鈴木さんの発表。

pvclustパッケージ開発者の一人で、最近データ分析ビジネスの会社を興したんだそうです。

 エスミみたいな会社なのかな、という印象を受けました。

 発表の内容は「データ分析ビジネスの現在」といった感じで、私も身近な話題で面白く聴くことができました。

 で、特に興味深かったのが鈴木さんがフリーソフトとして公開されているNatto

 これは発想として、リコー廣野元久さんのL-GM/G-GM東京大学大澤さんのKeyGraph、あるいはSPSS社Clementineに搭載されているWebグラフ数理システム社Text Mining Studioに搭載されていることばネットワークなどに似たようなものですが、インターフェイスがとても洗練されていて使いやすそうです。

 リンクの係数の出し方など詳細はまだ理解しきれていせんが、とりあえずAUTOCODEのサンプルデータからコーディングした結果をNattoに食わせてみたらこんな絵が描けました。

f:id:bob3:20061210204343p:image

 おお、なんか面白そうだぞ。

 通常のテキストマイニングの結果だと変数が100を越えるのですが、それでもちゃんと動くようなら結構使えるかも知れませんね。

 なお、Nattoのインストールには.NET Framework Version 2.0 再頒布可能パッケージインストールが必要な場合があるようです。(私のWindows2000のマシンでは必要でした。)


13:00-13:45「R graphical manualsの開発と今後の展開」

 驚異のR graphical manuals、とりわけ驚愕のImage Browserの開発秘話(?)。

国立遺伝学研究所小笠原さんと株式会社情報数理研究所服部さんによる発表。

 前半は小笠原さんからマクロアレイのデータを扱うことの難しさといったようなお話で、後半は服部さんからのR graphical manuals開発についてのお話でした。

 いや、それにしてもImage Browserは凄過ぎます。

 私も重宝してます。


13:45-14:30「GoogleEarth と言語

RjpWikiのokinawaさんこと牧山さんによる発表。

 これも興味深かったです。

 Rでいかに複雑な統計計算をするかという話ではなく、どうやってその結果を人に伝えるかというお話でした。

 ただそれゆえに、会場の魔人な方々からの反応はいまいちだったような気がします。

 ですが、個人的には自分が抱えている問題と共通する部分があって勉強になりました。

 統計数理研究所って上から見るとこんななんですねぇ。

 f:id:bob3:20061210211718j:image:small


14:50-15:35「地理空間分析のためのベクタデータモデル共通基盤−spパッケージクラスとメソッド−」

 長崎大学の谷村さんの発表。

 これは難しかった。

 最後の方の「直線距離じゃないクラスタリング」みたいな話は興味深く聴けました。


15:35-16:20「R 紹介のためのオープンソース原稿

 大トリ東工大間瀬さんの発表。

 Knoppixの起動画面をバックにマクラの話をする姿は、なんとも格好が良かった。

 あれはどこかで真似をしてみたいと思った。

 内容は「を紹介するプレゼン資料を作ったのでみんなで使えるように公開しますよ」といったお話。

 私もこれから人にを紹介する機会がありそうなのでこれも勉強になりました。


その他

 掲示板盛会御礼というスレッドが立ってます。

 久保さんのところにも当日のレポートが上がってます。

鈴木鈴木 2006/12/12 15:03 ef-prime 鈴木です。久保先生から教えていただきました。当日はお聞きいただき、かつNattoまで紹介していただいて、ありがとうございます。

このような0-1でコーディングされたデータの場合、Nattoの相関ルール探索機能が便利です。読み込み時の設定で「ローカルモード設定:バイナリ変数」を「1のみ利用する」に変更し、読み込み後にアイコンからローカルモードを起動すると、インタラクティブな相関ルール探索ができます。
(ただ実際やってみたところ、このデータではサンプル数が少ないのでこれといった結果は得られないようですが…)

ところでAUTOCODE、はじめて触りましたが面白いですね。使いどころが色々ありそうです。以上、長々と失礼いたしました。

鈴木鈴木 2006/12/12 15:07 ちなみに変数はメモリ512MB、サンプルサイズが1000くらいであれば500変数くらいまでは動きます。ただ、さすがにGUIのレスポンスが悪くなるので200変数くらいでお使いいただくことをお勧めいたします。

bob3bob3 2006/12/13 14:09 コメントありがとうございます。
Nattoはなかなか使えそうなツールですね。まずはいろいろなデータを突っ込んで試してみます。
相関ルール探索も試してみました。なるほどリフト値なども使えるのですね。ジャッカード係数なんかも使えるといいなぁ。
AUTOCODEは人力テキストマイニングといったところですがサンプルサイズが小さい時は便利です。サンプルサイズが大きい時は KH Coder の方がいいかも。

Connection: close