Part I(基礎)1統計学 ぱらぱらめくる『Algebraic statistics for computational biology』
Algebraic Statistics for Computational Biology
- 作者: L. Pachter,B. Sturmfels
- 出版社/メーカー: Cambridge University Press
- 発売日: 2005/08/22
- メディア: ハードカバー
- 購入: 1人 クリック: 9回
- この商品を含むブログを見る
統計学 | 代数幾何学 |
---|---|
独立 | Segre variety |
log-linear model | toric variety |
curved exponential family | manifold 多様体 |
mixture model | join of varieties |
MAP estimation | tropicalization |
... | ... |
- 1.1 離散データの統計モデル
- 代数統計モデルはd個の説明変数の(d次元)空間と状態空間(m次元空間、もしくは空間)とを対応付ける多項式関数と考える
- 尤度関数は統計モデルの部品である確率密度関数のパラメタと観測値(状態空間の値)とでできている。色々なことを観測してもよいけれど、色々な側面を観測すればするだけよい、というわけではなく、これを観測しておけば尤度の計算は可能、という観測量(統計量(スカラーだったりベクトルだったり))がある(十分統計量)(2項分布をモデルとしているときに、N回中n回、成功した、ということを観測すれば、それで十分)
- 1.2 線型モデルとトーラスモデル
- 1.3 EM(Expectation-Maximization)
- 線型モデル、トーラスモデル以外のモデルでは、最尤推定が単純な頂上探索では見つからない
- そのような場合によく用いる方法がEM法
- たいていの場合は極大に収束する(ときにそうならない)
- 2種類のステップE,Mがある。それを交互に繰り返す
- 1.4 マルコフモデル
- 1.5 グラフィカルモデル
- グラフィカルモデルというより、木を含めた「グラフ」上での遷移を扱うモデル、ということ(?)
- 統計モデルをd個のパラメタ空間からm個のパラメタ空間のマップとして扱い、その上の制約の集合のこととなる
- 離散を扱うのでグラフ上に表せる
Part I(基礎)2計算機科学 ぱらぱらめくる『Algebraic statistics for computational biology』
- 目次はこちら
- 離散アルゴリズムは数値アルゴリズムと並び立つもの。数値アルゴリズムは前章のEMもそうだし、固有値分解もそう。離散データには離散アルゴリズム
- 2.1 Tropical arithmetic と動的計画法
- 2.2 シーケンスアラインメント(配列を並べること)
- シーケンスアラインメントにトロピカル演算を用いて代数統計モデル化する
- 格子とその一方向対角線でできたグラフにモデル化できる。そのグラフがトロピカル演算の性質を持つ(?)
- 2.3 ポリトープ(多角形の一般次元化)
- 離散的データなので凸ポリトープとして取り扱えて、その上の適切な点の探索ととらえる
- 2.4 木と距離函数
- 系統樹という木と距離の保存、Neighbor-Joining
- 2.5 ソフトウェア
- 数学ソフト
- 生物用途ソフト
- "BLAST"
- "MAVID"
- "PAML"
- "PHYLIP"
- "SPLITSTREE"
Part I(基礎)3代数学 ぱらぱらめくる『Algebraic statistics for computational biology』
ring R=0,(p1,p2,p3),lp; ideal I = (p1^4+p2^4-p3^4,p1^4+p2^4+p3^4-2*p1*p2*p3,p1+p2+p3-1); ideal G = groebner(I); G; LIB "solve.lib"; solve(G,10);
- 3.2 Implicitization(陰函数化)
x <- seq(from=-2,to=2,by=0.01) xy <- expand.grid(x,x) X <- xy[,1]^2 Y <- Z <- xy[,1]*xy[,2] library(rgl) plot3d(X,Y,Z)
-
- マップには、d個の変数とm個の変数とが両方出てくるが、これをm個の変数だけで表すことが陰関数化
- その作業はマップについて、m個の変数だけでできたイデアルを探すこと
- 隠れマルコフモデルでは、表の変数セットと裏の変数セットがあって、マップがあるけれど、隠れている方はどうせ見えないから見えている方だけで考えられたらいいことがあるかもしれない→見えている変数のみのイデアルにするといいことがある
- それぞれの変数セットで環を作り、2つの環を結ぶマップ関数を指定し、片方の環とマップ関数とイデアルとを引数にpreimage()関数に渡すとできるようだ。ちなみに"preimage"は原像(こちら)
- SNPのHWEや連鎖平衡を代数統計する→こちら
- 3.3 最尤法
- 3.4 Tropical geometry
- 3.5 生命の木とtropical variety(代数学的多様体)
Part I(基礎)4生物学 ぱらぱらめくる『Algebraic statistics for computational biology』
- 目次はこちら
- 4.1 ゲノム
- 4.2 データ
- 4.3 問題
- 4.4 生物学の配列の統計モデル
- 4.5 変異の統計モデル