ゲノム(1)、ハプロタイプ、連鎖不平衡、因子の組合せ、アレル特異的機能差

MikuHatsune2012-10-16

ゲノム疫学のためのインフォマティクス2012 ゲノム(1)、ハプロタイプ、連鎖不平衡、因子の組合せ、アレル特異的機能差
 
case 100
ctrl 100
SNP 100,000
とすると
100,000 * 200 のgenotypeがある。
アレルを表すなら、3種類の文字があればよい
文字と区切り(\t, \, ,,,)と改行を使ってtxtファイルを作る。
\begin{matrix}&2&1&0\\case&&&\\control&&&\end{matrix}
の6個の部屋
60万の数値
SNPがn個あるとして、SNP s_i
\begin{matrix}&n_1&n_2&\dots&n_6\\s_1&&&&\\s_2&&&&\\\vdots&\vdots&\vdots&\vdots&\vdots\\s_n&&&&\end{matrix}

と並べる。
HWE
連鎖不平衡
DNA分子の上に複数の多型があるとする。一つの多型のアレルがわかると、別の多型のアレルがわかってしまうとき、この2つの多型は連鎖不平衡にあるという。
Wiki中の、「特定の組合せ(ハプロタイプ)の頻度が有意に高くなる集団遺伝学的な現象」と同じ。
 
A/T G/C のとき
A-G 30%
A-C 30%
T-G 30%
T-C 10%
SNP1のメジャーアレルはA
SNP2のメジャーアレルはG
p1 AA GG/GC/CC
p2 TT GG/GC/CC
 
10万個(ではないけど)のSNPをゲノムワイドに等間隔に配置したとして
r^2がたくさん計算される→_nC_2=\frac{n(n-1)}{2}

heatmapをピラミッド状に書き換える。
 
chr5 あるSNP_X(転写開始領域とか) AA AT TT
chr8 あるSNP_Y(アミノ酸変化を伴うCDSとか) GG GC CC
AA/CCのときリスクが上がる、とかすると
3*3の9通りのgenotype
SNP k個につき、3^k通り
 
heatmapを描いてくれるRがあった。
mapLD
ただし、出力が.epsというファイルで、Windowsだとデフォルトで開けなかったのでLinuxで作成した。

head(SNPdata)
     Allele1 Allele2 subjectID markerID position
4182       C       T        82      m13    18601
4526       G       T        82      m14    18601
4870       G       G        82      m15    18601
5214       A       A        82      m16    18601
5558       A       G        82      m17    18601
5902       G       T        82      m18    18601
library(mapLD)
data(SNPdata)
mapLD(SNPdata, locusID.col="markerID", subjectID.col="subjectID", allele.cols=c("Allele1", "Allele2"), outgraph="output.eps")
#SNPdata にはdataframeか、たぶんズラズラとvectorを入れればできそう。
#locusID.col にはマーカーのID
#subjectID.col にはサンプルのID
#allele.cols は比較する2つのアレル
#出力は現在のRディレクトリに.epsで出力される。ディレクトリと名前を指定できる。
#計算だけならNAを指定する。

$LDinfo
   LOCUSID1 LOCUSID2         f.AB         f.Ab         f.aB         f.ab
1         1        2 3.710638e-01 7.024109e-05 4.739362e-01 1.549298e-01
2         1        3 3.710660e-01 6.797557e-05 4.789340e-01 1.499320e-01
3         1        4 3.710654e-01 6.866209e-05 4.774195e-01 1.514465e-01
4         1        5 2.421140e-01 1.290201e-01 8.111836e-02 5.477476e-01
5         1        6 1.231615e-01 2.479725e-01 5.536062e-01 7.525980e-02
6         1        7 3.514525e-01 1.968151e-02 2.435475e-01 3.853185e-01
7         1        8 1.242309e-01 2.469031e-01 5.424358e-01 8.643023e-02
8         1        9 2.430293e-02 3.468311e-01 1.706971e-01 4.581689e-01
9         1       10 1.215552e-01 2.495788e-01 4.034448e-01 2.254212e-01
10        1       11 2.103941e-02 3.500946e-01 2.289606e-01 3.999054e-01
11        1       12 3.647589e-01 6.375138e-03 5.152411e-01 1.136249e-01
12        1       13 2.478409e-01 1.232931e-01 8.215910e-02 5.467069e-01
13        2        3 6.950694e-01 1.499306e-01 1.549306e-01 6.936818e-05
14        2        4 6.935546e-01 1.514454e-01 1.549302e-01 6.978936e-05
15        2        5 3.231589e-01 5.218411e-01 7.343453e-05 1.549266e-01
16        2        6 5.218411e-01 3.231589e-01 1.549266e-01 7.343453e-05
17        2        7 5.949298e-01 2.500702e-01 7.024109e-05 1.549298e-01
18        2        8 5.283996e-01 3.166004e-01 1.382671e-01 1.673290e-02
19        2        9 4.523015e-02 7.997698e-01 1.497698e-01 5.230152e-03
20        2       10 3.700702e-01 4.749298e-01 1.549298e-01 7.024109e-05
21        2       11 9.507024e-02 7.499298e-01 1.549298e-01 7.024109e-05
22        2       12 7.402118e-01 1.047882e-01 1.397882e-01 1.521180e-02
23        2       13 3.299298e-01 5.150702e-01 7.024109e-05 1.549298e-01
24        3        4 8.440579e-01 5.942119e-03 4.426968e-03 1.455730e-01
25        3        5 3.231643e-01 5.268357e-01 6.797557e-05 1.499320e-01
26        3        6 5.268357e-01 3.231643e-01 1.499320e-01 6.797557e-05
27        3        7 5.876428e-01 2.623572e-01 7.357234e-03 1.426428e-01
28        3        8 5.167346e-01 3.332654e-01 1.499320e-01 6.797557e-05
29        3        9 1.949226e-01 6.550774e-01 7.741409e-05 1.499226e-01
30        3       10 3.750680e-01 4.749320e-01 1.499320e-01 6.797557e-05
31        3       11 2.499320e-01 6.000680e-01 6.797557e-05 1.499320e-01
32        3       12 7.305915e-01 1.194085e-01 1.494085e-01 5.915092e-04
33        3       13 3.299320e-01 5.200680e-01 6.797557e-05 1.499320e-01
34        4        5 3.231637e-01 5.253212e-01 6.866209e-05 1.514465e-01
35        4        6 5.253212e-01 3.231637e-01 1.514465e-01 6.866209e-05
36        4        7 5.949313e-01 2.535535e-01 6.866209e-05 1.514465e-01
37        4        8 5.152202e-01 3.332647e-01 1.514465e-01 6.866209e-05
38        4        9 1.949559e-01 6.535290e-01 4.413456e-05 1.514710e-01
39        4       10 3.735535e-01 4.749313e-01 1.514465e-01 6.866209e-05
40        4       11 2.499313e-01 5.985535e-01 6.866209e-05 1.514465e-01
41        4       12 7.285459e-01 1.199390e-01 1.514541e-01 6.103572e-05
42        4       13 3.299313e-01 5.185535e-01 6.866209e-05 1.514465e-01
43        5        6 2.546708e-03 3.206856e-01 6.742210e-01 2.546708e-03
44        5        7 3.231825e-01 4.983098e-05 2.718175e-01 4.049502e-01
45        5        8 4.983579e-05 3.231825e-01 6.666168e-01 1.015085e-02
46        5        9 4.767514e-05 3.231846e-01 1.949523e-01 4.818154e-01
47        5       10 4.983579e-05 3.231825e-01 5.249502e-01 1.518175e-01
48        5       11 7.001839e-05 3.231623e-01 2.499300e-01 4.268377e-01
49        5       12 2.658345e-01 5.739781e-02 6.141655e-01 6.260219e-02
50        5       13 3.231825e-01 4.983098e-05 6.817508e-03 6.699502e-01
51        6        7 2.718175e-01 4.049502e-01 3.231825e-01 4.983174e-05
52        6        8 6.666168e-01 1.015084e-02 4.982586e-05 3.231825e-01
53        6        9 1.949523e-01 4.818153e-01 4.767223e-05 3.231847e-01
54        6       10 5.249502e-01 1.518175e-01 4.982797e-05 3.231825e-01
55        6       11 2.499300e-01 4.268377e-01 7.001839e-05 3.231623e-01
56        6       12 6.141655e-01 6.260219e-02 2.658345e-01 5.739781e-02
57        6       13 6.817512e-03 6.699502e-01 3.231825e-01 4.983569e-05
58        7        8 2.685222e-01 3.264778e-01 3.981445e-01 6.855545e-03
59        7        9 4.767514e-05 5.949523e-01 1.949523e-01 2.100477e-01
60        7       10 1.200701e-01 4.749299e-01 4.049299e-01 7.010346e-05
61        7       11 7.001839e-05 5.949300e-01 2.499300e-01 1.550700e-01
62        7       12 5.205301e-01 7.446988e-02 3.594699e-01 4.553012e-02
63        7       13 3.299483e-01 2.650517e-01 5.172606e-05 4.049483e-01
64        8        9 1.837150e-01 4.829517e-01 1.128502e-02 3.220483e-01
65        8       10 5.133799e-01 1.532868e-01 1.162009e-02 3.217132e-01
66        8       11 2.411249e-01 4.255418e-01 8.875130e-03 3.244582e-01
67        8       12 6.058176e-01 6.084902e-02 2.741824e-01 5.915098e-02
68        8       13 1.780783e-03 6.648859e-01 3.282192e-01 5.114117e-03
69        9       10 1.949523e-01 4.767223e-05 3.300477e-01 4.749523e-01
70        9       11 1.949523e-01 4.767223e-05 5.504767e-02 7.499523e-01
71        9       12 1.932826e-01 1.717398e-03 6.867174e-01 1.182826e-01
72        9       13 4.767514e-05 1.949523e-01 3.299523e-01 4.750477e-01
73       10       11 2.499300e-01 2.750700e-01 7.001839e-05 4.749300e-01
74       10       12 4.525514e-01 7.244863e-02 4.274486e-01 4.755137e-02
75       10       13 5.173097e-05 5.249483e-01 3.299483e-01 1.450517e-01
76       11       12 2.145699e-01 3.543008e-02 6.654301e-01 8.456992e-02
77       11       13 7.001839e-05 2.499300e-01 3.299300e-01 4.200700e-01
78       12       13 2.734894e-01 6.065106e-01 5.651060e-02 6.348940e-02
       DPRIME Lower  Upper                           LDstrength
1  0.99877896 0.578 0.9920                               Others
2  0.99877896 0.555 0.9920                               Others
3  0.99877896 0.537 0.9910                               Others
4  0.60093260 0.457 0.7100 Historical Evidence of Recombination
5  0.62975417 0.489 0.7350 Historical Evidence of Recombination
6  0.86905991 0.698 0.9400                               Others
7  0.58768531 0.446 0.6950 Historical Evidence of Recombination
8  0.66419028 0.278 0.8480 Historical Evidence of Recombination
9  0.37614537 0.199 0.5240 Historical Evidence of Recombination
10 0.77324194 0.487 0.8970 Historical Evidence of Recombination
11 0.85685453 0.439 0.9510                               Others
12 0.60410170 0.465 0.7100 Historical Evidence of Recombination
13 0.99701642 0.151 0.9760                               Others
14 0.99702832 0.155 0.9760                               Others
15 0.99853427 0.291 0.9850                               Others
16 0.99853427 0.291 0.9850                               Others
17 0.99923837 0.797 0.9970                            Strong LD
18 0.67613748 0.120 0.8990 Historical Evidence of Recombination
19 0.95808333 0.839 0.9860                            Strong LD
20 0.99904596 0.684 0.9950                               Others
21 0.99939578 0.877 0.9980                            Strong LD
22 0.18216124 0.043 0.9290                               Others
23 0.99862676 0.322 0.9860                               Others
24 0.96521668 0.881 0.9880                            Strong LD
25 0.99859800 0.428 0.9890                               Others
26 0.99859800 0.428 0.9890                               Others
27 0.91756601 0.651 0.9720                               Others
28 0.99864049 0.465 0.9900                               Others
29 0.99735336 0.225 0.9810                               Others
30 0.99904596 0.643 0.9940                               Others
31 0.99818732 0.430 0.9890                               Others
32 0.96713838 0.077 0.9600                               Others
33 0.99862676 0.452 0.9900                               Others
34 0.99859801 0.422 0.9890                               Others
35 0.99859801 0.422 0.9890                               Others
36 0.99923837 0.787 0.9970                            Strong LD
37 0.99864049 0.460 0.9900                               Others
38 0.99850621 0.215 0.9810                               Others
39 0.99904596 0.663 0.9940                               Others
40 0.99818732 0.365 0.9870                               Others
41 0.99664304 0.079 0.9610                               Others
42 0.99862676 0.446 0.9890                               Others
43 0.98835807 0.944 0.9960                            Strong LD
44 0.99961935 0.854 0.9980                            Strong LD
45 0.99976873 0.951 0.9999                            Strong LD
46 0.99924362 0.539 0.9920                               Others
47 0.99970632 0.907 0.9990                            Strong LD
48 0.99913352 0.703 0.9950                            Strong LD
49 0.22915215 0.035 0.5140 Historical Evidence of Recombination
50 0.99976990 0.965 0.9999                            Strong LD
51 0.99961934 0.854 0.9980                            Strong LD
52 0.99976878 0.940 0.9990                            Strong LD
53 0.99924366 0.539 0.9920                               Others
54 0.99970637 0.907 0.9990                            Strong LD
55 0.99913352 0.703 0.9950                            Strong LD
56 0.22915215 0.035 0.5140 Historical Evidence of Recombination
57 0.99976988 0.957 0.9999                            Strong LD
58 0.94921818 0.778 0.9820                            Strong LD
59 0.99958910 0.854 0.9980                            Strong LD
60 0.99963559 0.921 0.9990                            Strong LD
61 0.99952929 0.896 0.9990                            Strong LD
62 0.06316623 0.023 0.6420 Historical Evidence of Recombination
63 0.99961297 0.858 0.9980                            Strong LD
64 0.82638426 0.335 0.9410                               Others
65 0.93359947 0.811 0.9730                               Others
66 0.89349844 0.555 0.9630                               Others
67 0.23938721 0.038 0.5180 Historical Evidence of Recombination
68 0.99190553 0.940 0.9980                            Strong LD
69 0.99948532 0.779 0.9970                            Strong LD
70 0.99967404 0.910 0.9990                            Strong LD
71 0.92660691 0.079 0.9600                               Others
72 0.99925913 0.561 0.9920                               Others
73 0.99941037 0.846 0.9980                            Strong LD
74 0.16576540 0.026 0.5850 Historical Evidence of Recombination
75 0.99970141 0.907 0.9990                            Strong LD
76 0.06033419 0.019 0.6450 Historical Evidence of Recombination
77 0.99915129 0.714 0.9950                            Strong LD
78 0.21033088 0.031 0.5050 Historical Evidence of Recombination

$LDblock
  head tail                       contains
1    1    1                              1
2    2   11 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
3   12   12                             12
4   13   13                             13

$locusMap
   LocusName LocusIndex
1        m13          1
2        m14          2
3        m15          3
4        m16          4
5        m17          5
6        m18          6
7        m19          7
8        m20          8
9        m21          9
10       m22         10
11       m23         11
12       m24         12
13       m25         13