次世代シークエンサ(NGS)解析で使われるソフトの簡単なまとめ

  • 2010/5/25.EST assemblerのViewerに関して追記
  • 2010/6/9. ちょいちょい追記しています.
  • 2010/7/26. ちょいちょい編集しました.

少し調べたのでまとめを晒してみる.比較的よく使われて沿うなソフトをまとめてみました.既に解析をガシガシやられている先人の方から,こんなソフト使ってるよーとか,そんなん使わん,とか突っ込み歓迎です.あとソフトが見つからないところが有るので,補完コメントいただけると助かります.

主に2つの用途があると思います.

  1. ゲノム配列既知の種にNGSで読んだshort readをmapping
  2. ゲノム配列未知の種からNGSで読んだshort readのESTをアセンブル

(注)NGSの機材のメーカーIllumina/SOLiD/454によっても利用できるソフトウエアが変わります*1が,以下では一緒くたにして書いてあるので注意してください.454は配列が長いので従来のSanger法でのソフトが使えるケースがあります.SOLiDはcolor-space(http://seqanswers.com/forums/showthread.php?t=10 など参照)に対応しているか否かで使えるソフトが分かれます.(みゃー@ゲノムさん,ご指摘有り難うございます)

順に並べます(ソフトウエアはメーカ謹製のものではなく,アカデミアで自由に使えるものを中心に選んであります).

short readのassemblyが可能.マニュアルでは454対応と書いてあるが,ちょっときつそう.

  • Mapping以後の扱い(RNA-seq等)に関しては,上記では記述していません.

*1:454は400塩基位とSangar法に近い長さの配列を出力するのに対し,IlluminaやSOLiDは現状では100塩基以下の短い連続配列のみが読めます