Hatena::ブログ(Diary)

驚異のアニヲタ社会復帰への道

Prima Project

2014-03-22

MikuHatsune2014-03-22

Rで始めた医学・統計学・Bioinformatics

という本を書いた。

Rで始めた医学・統計学・Bioinformatics

Rで始めた医学・統計学・Bioinformatics

アマゾンKDPから買うと文字化けするため、こちらでは買わず代わりにとらのあなMelonbooks(審査中)で買ってください。

platexで書き始めたはいいが、電子書籍化するためにepubもしくはhtml化しようと思ったけど、epubpngしか受け付けずしかも数式、表はすべてレイアウトグダグダ、htmlはutf8にしてもKDPで文字化けがどうしても直らないので諦めた。

 

内容としてはこんな感じ。参考文献について自分周辺のものについてだけリンク貼っておいた。

 

グリコシミュレーション数理モデル

Rを始めたときにやったのがグリコ。そこから推移行列などで数理モデル化までやってみた初心者だったころの私。

プログラミングセミナー グリコ

京大入試数学2014

 

p値

統計のラボだったので、長らく統計について勉強させていただいた。プログラミングによるシミュレーションを併用すると理解が深まると思った。

ryamadaの遺伝学・遺伝統計学メモ マルチプルテスティングとFDR オミックス統計学入門2014

p値

サンプルサイズ

カプランマイヤー曲線のサンプル数

12/12 MIKUセミナー

数学いらずの医科統計学 第2版

数学いらずの医科統計学 第2版

 

嫁たちのスリーサイズ解析と予測

機械学習を勉強し始めてからの応用例。そのあとはバイオインフォマティクス手法なども用いてみたり。

ラブライブ!というアニメを観ていて

ガールフレンド(仮)のキャラ分析

ボディイメージ

(^q^)「くおえうえーーーるえうおおおwwwwwwwwwwwwwwwwwwwww」

機械学習を用いて双葉杏のスリーサイズ推定問題を解く

ミス・モノクロームのプロフィール推定

ガールフレンド(仮)のキャラ分析

Wake Up, Girls!のキャラ分析

Rでフローサイトメトリー(FCM/FACS)

ryamadaの遺伝学・遺伝統計学メモ cytoSPADE

SPADEを使いやすくする

二次元キャラの分化(成長)を多次元データ解析法で真面目にやってみる

viSNEによる次元削減とプロット

アイマス, ラブライブ, WUG, GFのキャラ分析

FRaC Feature Regression and Classification

外れ値となるアイマスメンバーを探す

デンドログラムをヒートマップのまわりに描き足す

 

ぼくのかんがえたさいきょうのせいゆうキャスティング

日本声優統計学会に声をかけていただいてから、解析がさらにおもしろくなった。ベタな線形回帰を使って、声優出演情報から円盤売上予測をしようという話。本書ではデータ取りの苦労話は割愛されているのでブログを読んで欲しい。次回もし参加することになっても、忙しすぎて原稿を書く時間がなければこの章がコピペで出されると思う。

ぼくのかんがえた さいきょうの せいゆう キャスティング

データ

重回帰法の落とし穴

分散拡大係数 VIF

機械学習の精度評価

交絡

 

これならわかる Excelで楽に学ぶ多変量解析

これならわかる Excelで楽に学ぶ多変量解析

 

百合ネットワーク解析

一時期ネットワーク解析にハマって、声優統計にも書いたネタ。

pixivのタグ頻度から考えるラブライブのカップリング

GRAph ALigner Algorithm (GRAAL)

GRAph ALigner Algorithm (GRAAL) を真面目にやる

ラブライブ!各話の百合ネットワークの動的変化

ネットワークの動的進化

R+igraphではじめる生物ネットワーク解析

 

アニメキャラで考える遺伝学

統計遺伝学的な話。ベイズ的思考も取り入れて事後確率の変動をどう考えるかという話もいれた。

海の人間と陸の人間の遺伝学

伊藤誠で作成しようと思ったら沢越止のほうが鬼畜だと気づいた

ベイズ的思考な遺伝相談

遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―

遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―

 

 

医師国家試験で考える勉強態度

マークシート試験で適当に解答しても合格基準を超えるのではないかという疑問があって、どれくらい勉強したらいいかを考えた。得点予想など時系列解析も含む。

試験の合格基準は6割です

試験に合格するためにぎりぎりを目指すのもいいけどどれくらいがんばればいいかわからない人に

試験問題が多いと大変ですね()

挑戦回数による合格率の変化

項目応答理論

 

線形計画法ストーキング

シンプレックス法と並列計算によるシミュレーションで、班分けを考えた話。並列計算はこのときに勉強したが、まさかこんなことで使うと思わなかったし、このときの経験が今後ものすごい活きてくるとはまったく思わなかった。

シンプレックス法を用いたコース割当シミュレーション

線形計画法を用いて当直の最適な割り当てを考える

ryamadaの遺伝学・遺伝統計学メモ 2次計画問題

安定マッチング問題

就職活動希望先の地域差

沖縄だけ絶妙に例外的に描く

 

ド素人が始めるテキストマイニング

テキストマイニングもやってみると面白かった。周りの人にはこれをやっている人は少ないけれども、この応用範囲は広くて、これ自体に興味を持っている人が多かったので勉強になったし、話のネタにもなった。

MeCabの辞書をはてなキーワードで充実させるのにものすごい苦労した話

声優統計第二号 トピックモデルを用いたニコニコ動画コメントデータの声優トピック流行推移解析

初音ミクの流行解析をDTMで

トピックモデルを使ってラブライブの歌を解析する

ラブライブ スクフェスの楽曲属性をCTMで予測する

47の心得シリーズをトピックモデルで分類する

 

声優の声に魅せられて

声優統計の音声解析に興味を持って、Rでもできるらしいと知ってやってみた。やってみたはいいがかなり難しく、これ以上の勉強が進んていないのは残念。

声優統計第三号 複数の声優によるセリフの音響的類似性の考察:不愉快です

 

RでGIS

空間的なものの処理とか統計とかそういう知識はほとんどないのだけれども、

祇園祭の山鉾の最適巡回経路

RGoogleMapでGoogleと連携してiPhone5sの繋がりやすさをプロットする

 

Rでお絵描き

Rの真骨頂は柔軟なプロット機能だと思っているので、Rでアイコンを作成することなぞ造作も無い。

みくみくにしてやんよ

みくみくにしてあげる

初音ミク関数

おっぱい関数

KABIRAの日記 3dの拡散

KABIRAの日記 3dでの拡散

細胞カウント

 

あとがき

バイオインフォマティクスといいながらあんまりバイオインフォマティクス成分がなかった件。UCSC Genome Browser をRのplotで再現するということも可能。

これからはこちらを参考にBUGSをやってみようかなと思う。とりあえず

RStanを入れないといけないっぽい。