統計数理研究所

統計数理研究所の外見はこんな感じです。

……嘘です。


こんな感じ。

……こっちは嘘じゃないですが、多少誇張しております。


実際はこんな感じ。天気が悪いのが残念でした。

国立極地研究所国文学研究資料館も同じ建物に入居しています。


そんなわけで1階ではペンギンとアザラシがお出迎えしてくれます。



3階にRユーザー会の会場はありました。

第4回Rユーザー会

結論から言うと、今回のRユーザー会の個人的なキーワードは、

「現実をしっかり見据えましょう。
統計で最も広く使われているソフトウェアは Excel なのです。」

でした。


それと講演中に“なう”なヤングたちがtwitterでtsudaってる姿も、これまでには無かった風景でしたね。
ハッシュタグ#rjpusers2009ですか。


以下、個人的なメモです。
いずれそれぞれの発表資料が公開されると思われますので、正確な情報はそちらを参照してください。

09:00-10:25 KMLとR

okinawaさんこと牧山文彦さんによるGoogleEarthなお話。第2回のRユーザー会でもGoogleEarthでRを使うお話をされていましたが、今回はもう一段突っ込んでGoogleEarthで使われるXMLベースのマークアップ言語であるKMLをRで扱うというテーマ。

10:30-11:00 RExcelパッケージの紹介

石田基広さんの発表。
一見、“裸の大将”的な風貌の方ですが、話し方も話の組み立ても上手いなぁ。
プレゼンの仕方を見習いたいです。
準備中のデスクトップにはWordMinerTextMiningStudioのアイコンも見えて、個人的には親近感を覚えました。

  • R in Emacs on Ubuntu は便利。
  • でも、学生に教えるときは英語&CUIという段階で全滅。
  • PC100台中SPSSが導入されているのが10台、という状況なので止むを得ずExcelで統計の講義。
  • R Through Excel』翻訳中。「現実をしっかり見据えましょう。統計で最も広く使われているソフトウェアはExcelなのです」
  • そこで、RExcel登場。statconnからダウンロードしてインストールすると、R本体を含めて必要なパッケージ丸ごと一気に導入できる。
  • RExcelを起動するとExcelのメニューにRcmdrのメニューが追加されている。Excel上のデータをRに送ったり、RのグラフをExcelに出力したり。

11:05-11:35 Rによる環境疫学・大気汚染の健康影響

谷村晋さんのRを使った研究事例の発表。

  • 季節変動、週間変動などを組み込んだモデル作り。
  • それでも当てはまりが良くならないので、交絡因子を探索する。フェイラー変換(?)。気温?

13:00-13:30 HTMLアプリケーションを用いた簡易Rツールの作成

毎度おなじみR-Tips船尾さん
発表資料はここにあります。
本当にプレゼンテーションの上手い方だと思います。
きっちり笑いも組み込んでくるし。

できれば、R2PPTパッケージのお話も伺いたかったなぁ。

オープンなビジネスデータ分析環境

エフプライムの鈴木了太さん。
まずは第3回Rユーザー会で発表されたR AnalyticFlowのバージョンアップの話。
R AnalyticFlowは、まぁ要するにRをClementineのように使おうというツール。
オブジェクトブラウザとコードエディタが便利そう。
R Foundationに寄付をしている日本の企業はエフプライムだけだそうです。
クロスマーケティングあたりはお金を出したほうがいいんじゃないかと思いますがねぇ。

RとFOSS4G

岡田昌史さんの講演。RjpWikiの中の人ですね。
FOSS4G(Free and Open Source Software for Geospatial)というのはオープンソースな地理情報ソフトウェアの総称ということでした。
まずはGRASSというソフトとRを組み合わせる話。
Rのspgrass6パッケージを使うとGRASSのコマンドライン上でRが動くと言う感じ。
もうひとつ紹介されたのはQGIS。こちらはmanageRというパッケージを使うそうです。

R running on mobile gadgets

こちらも続けて岡田昌史さんの講演。
RjpWikiの該当ページはこちら
シャープのNetWalkerubuntuで動いているそうでまったく問題なくRが動くそうです。
もちろん速度はそれなりのようですが。
通勤中の電車の中でコードをいじりたくなるときなんかは実際あるので、ちょっと欲しいかも。
もうひとつNokia N810でも動いてました。こちらはLinuxベースのMaemoというOSで動いているそうです。

Tsukuba.Rの活動

今回のRユーザー会で楽しみにしていた講演のひとつです。
はてな界隈でも活発に活動されているid:syou6162さんのお話。
Tsukuba.RはRについて関心のある若者の集いと言う感じでしょうか。
大学生のサークル活動の延長と言った雰囲気で非常に楽しそうに活動されている様子が伝わってきました。
楽しいって言うことは大切だね。

インタラクティブPDF作成ライブラリPDF2の紹介

id:tadakadoさんの講演。
Rで出力するPDFファイルにハイパーリンクを埋め込むパッケージ。
ポップアップで説明を表示させることができたり、なかなか使えそう。
高橋メソッドでの発表って、実際にやってるのは始めて見ました。

Rcmdrによる教育用パッケージの開発 品質管理の場合

荒木孝治さんによる講演。
Rcmdrの日本語化に尽力された方ですね。
日本独自のQCの“作法”に対応したRcmdrのプラグインや教育用のプラグインのお話。
こちらも高橋メソッド

  • RやWekaニュージーランドで生まれたのは、充実した統計教育の賜物。
  • 日本でも産業界、特に品質管理(QC)の分野ではきちんとした統計教育が求められている。
  • 「現地、現物のデータで現実を知る」
  • QCの世界ではStatWorksがメジャーだが高価。

タグチメソッドはJMPにも搭載されてましたね。
Rではタグチメソッドのパッケージが無い? DoE.baseパッケージあたりは対応してないのかな。