先日行われた BUGS/stan勉強会 #3 で発表させていただきました。
タイトルは「Stan で欠測データの相関係数を推定してみた」です。
欠測データに対して相関係数を求めるとき、普通のやり方では実際の値より小さい値になってしまいます。そこで、片側だけしか観測できていない不完全データを用いて推定精度を上げる方法を紹介しています。
スライドは下記にアップしています。
最終的なコード全体はこちらに載せています。
Stan の勉強にあたっては、ごみ箱さん、beroberoさん、伊東さんにアドバイスを頂きました。ありがとうございます。
hoxo_mさんのバイアスの掛かったデータの相関係数の問題、よく使われる統計手法からの発展としてすごくいい例だし、片方しか観測されていないデータを使ってもあれほど改善するとは驚いた。#TokyoBUGS
— ホクソエム (@berobero11) 2014, 7月 12
beroberoさんにほめていただけるような発表ができて良かったです。
次回以降の BUGS/Stan 勉強会は新しい動きがあるようなので、主催者の中川さんのブログをチェックしてみてください。
追記
set.seed(123) N <- 1000 x <- rnorm(N, mean = 50, sd = 10) y <- 10 + 0.8 * x + rnorm(N, mean =0, sd = 7) data <- data.frame(x, y) data_full <- subset(data, x >= 60) data_miss <- subset(data, x < 60) data_miss$y <- NA d <- rbind(data_miss, data_full) library(psych) corFiml(d)
x y x 1.0000000 0.8169659 y 0.8169659 1.0000000