2014年の論文より ロバストな大規模配列解析は、生物学者が何百万もの配列の特徴を明らかにしようとしている現代のゲノム科学における大きな課題である。ここでは、広く使われているタンパク質機能予測ソフトウェアパッケージInterProScanの新しいJavaベースのアーキテクチャについて述べる。開発には、ソフトウェアの出力に対する改良と追加、ソフトウェアフレームワークの完全な再実装が含まれ、その結果、スケーラブルな分散データ解析を実現するために、マルチプロセッサマシンや従来のクラスタの両方を使用できる、柔軟で安定したシステムを実現した。InterProScanはEMBl-EBIのFTPサイトから自…