ブログ再開します。
テーマは、「Long read・ロングリード」。
ロングリードのパフォーマンス
ロングリードの技術は
PacBio RSII
最近の実績は、1CELLで800Mbp以上は普通に読めます。1Gbp前後読めている場合がほとんどです。バクテリアのゲノム長が4Mbpとすると、200倍読めていることになるので、アセンブルして得られるContigは、一本に繋がり、コンセンサス配列の品質もかなり良いようです。
PacBio Sequal
1CELLで3Gから4Gbp読めてしまいます。品質はRSIIと同じです。1CELLの量が約4倍になって、RSIIを4CELLRUNさせるよりコストが下がりました。
Oxford Nanopore MinON
1CELLで10Gbp以上読めるとのことですが、まだ、コメントできるほどの実績がありません。 ただ、非常に良くないリードでも、放線菌ゲノムが一本になるということは経験しています。
ロングリードのメリット
ロングリードのメリットは、ゲノムの一次構造が明確になることです。もちろん、数キロ以上のリピートがあれば、それを捉えることは難しいかもしれませんが。
一次構造が明確になると、ショートリードでは見えなかった、大きな領域の転座や逆位が見えてきます。そして、近縁株間で大きなゲノム構造の起こった領域の境界にある遺伝子が影響を受けていることがわかります。これは、ショートリードでは見えない場合がほとんどです。
また、同じ遺伝子が複数個所にあることもわかります。それらの遺伝子がすべて完全に配列が一致しているわけではないこともわかります。しかし、ショートリードではこれを見極めるのは難しいと思います。