ryamadaの遺伝学・遺伝統計学メモ このページをアンテナに追加 RSSフィード

数学・コンピュータ関連の姉妹ブログ『ryamadaのコンピュータ・数学メモ』
京都大学大学院医学研究科ゲノム医学センター統計遺伝学分野のWiki
講義・スライド
医学生物学と数学とプログラミングの三重学習を狙う学習ツール
駆け足で読む○○シリーズ
ぱらぱらめくるシリーズ
カシオの計算機
オンライン整数列大辞典

2009-11-01 Mantel-Haenszelメモ

[][]最大値

  • ¥chi^2_1=¥frac{d_1^2 n^3}{¥prod n}
  • ¥chi^2_2=¥frac{d_2^2 m^3}{¥prod m}
  • ただし、¥prod n=n_{1.}n_{2.}n_{.1}n_{2.}
  • ¥chi^2_{MH}=¥frac{(d_1+d_2)^2}{¥frac{¥prod n}{n^3}+¥frac{¥prod m}{m^3}
  • ¥chi^2_1,¥chi^2_2,¥chi^2_{MH}の大小関係について、みてみる
  • ¥chi^2_{MH}-(¥chi^2_1+¥chi^2_2)
  • =¥frac{1}{m^3¥prod n +n^3 ¥prod m}(¥sqrt{¥frac{¥prod m}{¥prod n}}n^3 d_1-¥sqrt{¥frac{¥prod n}{¥prod m}}m^3 d_2)^2

2007-11-04 メタアナリシス メモ

[][][]メタアナリシス

オリジナルペイパー

Random-effects model for meta-analysis of clinical trials: An update

Rebecca DerSimoniana,et al.

リンク

信頼区間 リンク

Heterogeneity in Meta-Analyses of Genome-Wide Association Investigations

John P.A. Ioannidis1,2,3*, Nikolaos A. Patsopoulos1, Evangelos Evangelou1

PLoSリンク

PDF1

PDF2

リンク

  • Funnel plot
    • 横軸に、スタディの効果の強さ(ORなど)をとり、縦軸にスタディの正確さに対応する量(スタディサンプルサイズなど)をとって、2次元プロットすると、パブリケーションバイアスがなければ、横軸について左右対称な山型、1ピーク(漏斗(ろうと・じょうご)をさかさまにした形)になる。このことを確認するための図。ネガティブ側のスタディが欠けると、形の左右差がくずれて、効果の弱い側の点が少ないプロットとなる。
  • Fixed effects model と random effects model
    • 複数のスタディにつき、効果の強さが同一であるとする仮定をするのがfixed effects model、スタディ間では効果の強さが異なる(こともある)ことを仮定するのがrandom effects model
    • 手法としては
      • Fixed effects model
        • Mantel-Haenszel method
        • Peto method
        • General variance-based method
      • Random effects model

[][][]DerSimonian-Laird

複数のスタディがあり、それぞれのサンプルサイズをn_i、因子陽性サンプル数をm_iとしたときに、スタディの重みを、w_i=n_i+1に比例してとる(観測データからの母分散・・・)。因子陽性についての統計量x_ix_i=arcsin(¥sqrt{¥frac{m_i}{n_i+1}})+arcsin(¥sqrt{¥frac{m_i+1}{n_i+1}})

とし、複数スタディにおける、この統計量xのばらつき具合を評価して、¥tauなる数値を得て、これから、各スタディのx_iの補正を行ったうえで、補正後x_iから、全スタディを通じた因子陽性比率の推定値を得る、手法。さらに、それに信頼区間を算出し、また、その推定値が帰無仮説における値をまたがない確率としてP値を得る。

推定値を計算してみるエクセルはこちら。その検算のためのサンプルでは、前記事掲載のこちら

2007-11-03 GWAにおける自由度諸相覚書

ryamada222007-11-03

[][][][][][]GWAにおける自由度諸相覚書

関連記載はこちらの『バイオインフォマティクス研究者と医学研究者の交流会(2007)』

2007-10-26 複数の多テストスタディの累積(6)

ryamada222007-10-26

[][][][]多重検定を重層的に繰り返したとき(6)Mantel-Haenszelは自由度=層数のカイ自乗統計量の1次元投影量である

この日の記事の問題点は

『統計量P_j=¥prod_{i=1}^M p_{ij}を考えたこと』

独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。

以下の記述は、この点について問題があることに留意しつつ、積分その他については、メモとして使うので、残す。

この留意は以降、『複数の多テストスタディの累積』のシリーズの(6)、2007/10/26まで適用されるべきである。

今、単純のために、2x2分割表検定を2コホートにて行っているものとする。

Aasum
group_{11}n_{11}n_{12}n_{1.}
group_{12}n_{21}n_{22}n_{2.}
sumn_{.1}n_{.2}n

Aasum
group_{21}m_{11}m_{12}m_{1.}
group_{22}m_{21}m_{22}m_{2.}
summ_{.1}m_{.2}m

コホートごとに、カイ自乗統計量が算出できる。今、分割表の期待度数をE(n_{11})のように書き表すとすると、

¥chi^2_1=¥frac{(n_{11}-E(n_{11}))^2¥times n^3 }{n_{1.}n_{2.}n_{.1}n_{.2}

¥chi^2_2=¥frac{(m_{11}-E(m_{11}))^2¥times m^3 }{m_{1.}m_{2.}m_{.1}m_{.2}

一方、MHの統計量は

¥chi^2_{MH}=¥frac{(¥frac{(n_{11}n_{22}-n_{12}n_{21})}{n}+¥frac{(m_{11}m_{22}-m_{12}m_{21})}{m})^2}{¥frac{n_{1.}n_{2.}n_{.1}n_{.2}}{n^2(n-1)}+¥frac{m_{1.}m_{2.}m_{.1}m_{.2}}{m^2(m-1)}}

今、d1_{11}=n_{11}-E(n_{11},d2_{11}=m_{11}-E(m_{11})とすると、n_{11}=E(n_{11})+d1_{11},n_{12}=E(n_{12})+d1_{11},n_{21}=E(n_{21})-d1_{11},n_{22}=E(n_{22})+d1_{11}などと表せることから、E(n_{11})E(n_{22})-E(n_{12})E(n_{21})に注意すれば

¥chi^2_{MH}==¥frac{(d1_{11}+d2_{11})^2}{¥frac{n_{1.}n_{2.}n_{.1}n_{.2}}{n^2(n-1)}+¥frac{m_{1.}m_{2.}m_{.1}m_{.2}}{m^2(m-1)}}

と変形できる。

この式からわかるとおり、¥chi^2_{MH}は、d1_{11}+d2_{11}が同一なテーブルにおいて、同一な値をとる。

今、¥chi^2_{MH}は、補正項による、多少の誤差はあるが、¥chi^2_{MH} ¥le ¥chi^2_1+¥chi^2_2なる関係にある(掲載図は、ランダムな2x2分割表のペアについての¥chi^2_{MH}¥chi^2_1+¥chi^2_2とのコプロットである。大小関係が見て取れる)。

また、こちらの図は、縦軸にd1_{11}、横軸にd2_{11}をとり、¥chi^2_{MH}の値で等高線プロットをしたものである。d1_{11}+d2_{11}が等しいテーブルには、同一の¥chi^2_{MH}値が対応していることがわかる。このように、2次元の図であるが、1次元への写像としての性質を持つことから、Mantel-Haenszelの統計量は自由度1でp値を得ることができる。

同様に¥chi^2_1+¥chi^2_2をプロットしたのが、こちらの図であり、こちらは、2次元の分布を撮っていることがわかる。

これらの具合を試してみるために雑に作ったエクセルは、こちらこちら

2007-10-24 複数の多テストスタディの累積(5)

[][][][]多重検定を重層的に繰り返したとき(5)

この日の記事の問題点は

『統計量P_j=¥prod_{i=1}^M p_{ij}を考えたこと』

独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。

以下の記述は、この点について問題があることに留意しつつ、積分その他については、メモとして使うので、残す。

この留意は以降、『複数の多テストスタディの累積』のシリーズの(6)、2007/10/26まで適用されるべきである。

Mantel-Haenszelとp’=p1¥times p2で、p_{cor}=p’(1-¥frac{1}{2}log(p’))との間にはどんな関係があるのだろうか。

第1セットと第2セットで全く同一の対立仮説が最尤となるようなとき、Mantel-Haenszelは、p(1-¥frac{1}{2}log(p))よりも小さなp値を返す。

両法は、ともに、補正後p値が0−1均一分布することから、どこかで、小さめのp値を返しているということは、それ以外の場合に大きめのp値を返していることとなる。したがって、2セットのおのおのから最尤推定される対立仮説の差が大きいときには、Mantel-Haenszelは大きめのp値を返している(はず)。