NATROMのブログ

ニセ医学への注意喚起を中心に内科医が医療情報を発信します。

Bonferroni の補正

こないだの補足。「長距離選手の遺伝子を調べたら、有意に『持久型』のタイプが増えていた」という報告に対し、ホントに?という懐疑的な見方をしたわけだ。今後もこの手の話が話題になることもあるだろうが、「ボンフェローニの補正はしたの?」と冷めた見方をする嫌な奴になろう。ボンフェローニの補正てのは、「施行回数が増えたら、それだけ偶然に有意差が生じる可能性が増すので、補正せんといけん」ってこと。以下、ヒトの分子遺伝学第二版 (メディカル・サイエンス・インターナショナル、Tom Strachan and Andre P.Read著)よりの引用。


相関研究から計算された確率は検討された数で補正しなければならない
[相関研究では]まったく相関が見つからない場合もあるし、各検定には偽陽性である危険も独立に存在する。エラーを避けるためには、補正を行う必要がある。有意水準は、通常のp=0.05ではなく、p=0.05/nとする。ここでのnは、それぞれ独立に検討した相関を解析した数である。これはBonferroniの補正(Bonferroni correction)と呼ばれる。(P317)

たとえば、4個のSNPsについて検定したら、有意水準はp=0.05ではなく、P=0.05/4=0.0125になるわけね。4つのSNPsを使用した研究では、ぎりぎりP<0.05となっても、有意とは言えない。p<0.0125となって初めて、通常のP<0.05と同程度の有意水準をクリアしたとみなす。厳しい。押田芳治教授の研究では使用した遺伝マーカーが4つだったからよかったけど、ゲノム全体の相関解析をするときには、数万個のマーカーを使ったりする。新聞などには補正前のやたらと低いP値*1が出ていたりするが、原著を参照すると補正するとやっとこさP<0.05とかいう数字だったりする。他にも偽陽性が生じうる要素があるし、こうした話はとりあえず追試されない限りは、懐疑的に見ておいたほうが無難。「ヒトの分子遺伝学」には、上記引用部分に続けて、こう書かれている。


・・・こうした厳格な補正が適用されている研究は非常に少数である*2。したがって、ある研究で報告された相関が、別な患者集団を用いた別の研究で再度確認されることは非常に少ない。


*1:実際のP値にnをかけて補正する場合もある。4個のSNPsについて検定を行った場合、有意水準をP=0.05/4=0.0125とする代わりに、実際のPに4をかけてPを補正する。実際のP=0.01だったら、それに4をかけて、P(補正後)=0.04と考えるわけ。

*2:引用者注:1999年での話。最近は、特によい雑誌に載るものは、きちんとなんらかの補正がなされている。