ウイルスの研究はメタゲノムシークエンシングを用いて行われることが多いが、ゲノムの不完全性が包括的で正確な解析の妨げとなっている。Contig Overlap Based Re-Assembly (COBRA)は、de Bruijnグラフに基づいてアセンブリのブレークポイントを解決し、コンティグを結合する。ここでは、海洋と土壌のウイルスデータセットを用いてCOBRAのベンチマークを行った。COBRAはアセンブルされた配列を正確に結合し、ビニングツールよりも顕著に高いゲノム精度を達成した。231の淡水メタゲノムから、7,334のバクテリオファージクラスターが得られた。COBRA解析前は34%であっ…