2011-03-01から1ヶ月間の記事一覧

すべてのハプロタイプは世界に1本だけ配列のとき

SNPのハプロタイプは0,1 Nh<-10 # 染色体本数 Nm<-20 # SNP数 # 適当にハプロタイプを作る H<-matrix(sample(c(0,1),Nh*Nm,replace=TRUE),Nh,Nm) 染色体が2本合わさってディプロタイプを作る 染色体のプールからランダムにペアを作るとそれはHWE仮定 Shuffl…

全染色体識別可能状態に関する評価の助走

研究環境の提供

ドイツの友人から、こんなサイトを紹介されました。 研究環境について、復興も大切だけれども、退避する必要のある人もあるかもしれない。 いずれにせよ、情報はあって損はないので。 ドイツから研究者向けの支援プロジェクトのポータルサイト(こちら)

研究ポストを海外へ

SpherePower()

Sweave()を使って解説文書のメモを作る Sweaveのファイル"FxPowerSphere.Rnw"(末尾)を作って Sweave("FxPowerSphere.Rnw") と実行するとできる"FxPowerSphere.tex"をてふ処理してPDFにしたのがこちら "SpherePower.R"関数はこちら "FxPowerSphere.Rnw"は以下…

平成23年度前期初学者用

平成23年度の初学者用ペーシングテキストはこれにしよう Applied Statistical Genetics with R: For Population-based Association Studies (Use R!)作者: Andrea S. Foulkes出版社/メーカー: Springer New York発売日: 2009/05/06メディア: ペーパーバック…

距離に比例する

今、自由度をとする 帰無仮説の棄却検定の統計量をとする ここで、ある対立仮説で最も観察されやすい統計量がであるとする このときにパワーがであるという との関係は(ほぼ)比例するらしい のときには、らしい 自由度がのときにでパワーが0.5になるのは、す…

パワーが50%になる距離

ソースメモ

次元で丸くするかボンフェロニか df1<-1 df2s<-1:5 pdf1<-10^(-9:-1) pp<-matrix(0,length(df2s),length(pdf1)) for(i in 1:length(df2s)){ df2<-df2s[i] probs<-pchisq(qchisq(pdf1,df1,lower.tail=FALSE),df2,lower.tail=FALSE) plot(probs) probs plot(pr…

自由度が高くなると、関係が薄い代用マーカーの方がパワーをより高く上げる

昨日まで、検出力と非心カイ二乗分布のことを書いている こんな場合を考えよう あるマーカーが真の関係があるとする その真のマーカーだけで関連検定をするときのパワーは簡単に計算できる 非心カイ二乗分布を持ち出せば、任意の自由度での検定にあっても、…

どのくらい近い関係がパワーを上げるか

自由度とパワーのこと

一昨日、検出力と非心カイ二乗分布のことを書いた 今、自由度が1のとき、検定のカットオフカイ二乗統計量をとする ここで、カイ二乗統計量がとなるような仮説が真の仮説(対立仮説)であるとすると、その真の仮説からのランダムサンプリングによって、最も観…

パワーと自由度

パワー 非心カイ二乗分布 モンテカルロ

昨日、検出力と非心カイ二乗分布のことを書いた 中で使用している"RandomSphere()"はこちら Ntrial<-100 Ma<-30 as<-seq(from=0,to=Ma,length.out=Ntrial) # 検定の有意水準はa^2できることにする N<-10000 # 乱数点の数指定 k<-sample(2:10,1) # 次元を指定…

パワーを球面乱数で出す

非心カイ二乗分布

昨日、検出力のことを書いた 独立性検定が、自由度次元空間である点を中心とした標準正規分布の生起確率を仮定し、統計量がそこからの距離の二乗に応じて減じるものであるとしたものであると示した 今、任意の点が真値であって、そこからの逸脱が標準正規分…

非心カイ二乗分布と検出力

ピアソンの独立性の検定

ピアソンの独立性検定では、適当な座標変換を施すことにより、表を自由度次元空間上の点に対応付けることができる そのうえで、さらに適当な座標変換により、ピアソンの独立性検定のカイ二乗値の平方根を原点からの距離とする、自由度次元空間上の点に対応づ…

検定と検出力、仮説とモデル

今、次元空間を考える この空間に確率密度分布があるとする 定義より にを定義すると、 一方、同じ空間に統計量を定義する 空間に定義されたある確率密度分布があるとき、 を定めることができて、 である ここで、空間において、2つの統計量があったときに…

輪読の仕方を手ほどきする

教科書を読むことは非常に勉強になる Essential Cell Biology作者: Bruce Alberts,Dennis Bray,Karen Hopkin,Alexander D Johnson,Alexander Johnson,Julian Lewis,Martin Raff,Keith Roberts,Peter Walter出版社/メーカー: Garland Science発売日: 2009/04/…

想定外

東北地方で大地震がありました。 地震の強さは観測史上最大とのこと。 津波の高さもまれに起きる事象に関すること。 このように分布の裾の極端に大きな値(または極端に小さな値)に関する統計は極値統計。 原子力発電所では、想定外(極値統計で想定した、その…

インターベンション直後に起きやすいイベント

少し具体的にする 今、100万人の集団があるとする そのうち、半分が一斉にインターベンションを受ける インターベンションを受けた人だけに着目し、イベントが起きたら、「インターベンションの○日後にイベントが起きた」と記録することにする このイベン…

偶発事象が介入の直後に起きるとき

今、多くのサンプルがあって、そのサンプルの一部に、何かしらのインターベンションを適当な日に実施することとする 一方、このサンプルには、偶発的に何かしらのイベントが起きるものとする さて、インターベンションとイベントとの間隔はどのような分布に…

正単体座標系で分割表を空間配置する

昨日の続き 昨日の正単体座標系では、重心を中心とする正単体頂点の位置ベクトルを用いて、和の固定された変数のセットを次元空間の点に対応付けた 今日は、周辺度数が固定された2次元分割表(分割表)の個の変数のセットを次元空間に対応付けるような「正単…

正単体座標系

『正単体座標系』は、和が一定であるという制約を持つ個の変数のセットに対して、次元空間座標を対応付ける系である 以下、説明 正単体 正単体とは、2次元空間における正三角形を任意の次元に拡張したものである の場合は線分 の場合は正三角形 の場合は正…

双曲線

多次元球で分割表を表すとき 対立仮説を表す点から、ある方向に移動する(生起確率を下げていく)ときに、その距離と統計量との関係は双曲線になる 出発点が帰無仮説のときには、双曲線の極限としての折れ線 r<-seq(from=-3,to=3,by=0.1) b<-1 t<-pi/2+1 plot(…

多次元球座標で対立仮説が成り立つとき

分割表の正球化したら、コンビネーションも正球化しよう

こちらなどでpermutohedronについて書いた パーミュテーション(順列)はマルチプルテスティングでも用いる 順列が多次元空間でどのように配置されるかは、気にしているところ(こちらなど) そんなパーミュテーションが多次元球面配置されるのだが、その「座標…

コンビネーションの図示

総集編4

その他 共役事前分布(確率密度分布と尤度分布) 二項分布とベータ分布のような こちら 漸近近似 正規分布近似(大数の法則・中心極限定理) より広い収束は安定分布への収束 安定分布としてはこちらやこちらなど