Exome 解析に使うツール群のリンク (主に Exome)
ツールアップデートめんどいので、なるべく CUI からいけるように付記したバージョンを書き起こした。
- FastQC
http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc/
- FASTX-Toolkit
http://hannonlab.cshl.edu/fastx_toolkit/
- Burrows-Wheeler Aligner
http://bio-bwa.sourceforge.net/
https://github.com/lh3/bwa
git clone https://github.com/lh3/bwa.git
bwa-0.6以降では SOLiD/colorspace 対応がなくなっている様子 (オプションとしては見えるが、README か NEWS にそう書かれている)。必要な場合は bfast や bwa-0.5.10など対応版を使うしかなさそう。
- SAMtools
http://samtools.sourceforge.net/
svn co https://samtools.svn.sourceforge.net/svnroot/samtools/trunk/samtools
- Picard
http://picard.sourceforge.net/
svn co https://picard.svn.sourceforge.net/svnroot/picard/trunk picard
- bedtools - bedtools: a flexible suite of utilities for comparing genomic features.
http://code.google.com/p/bedtools/
https://github.com/arq5x/bedtools
git clone https://github.com/arq5x/bedtools.git
- ANNOVAR website
http://www.openbioinformatics.org/annovar/
作者にメールする必要がある
- GATK
http://www.broadinstitute.org/gsa/wiki/index.php/Home_Page
git clone https://github.com/broadgsa/gatk.git
- Dindel: Accurate indel calls from short-read data - Wellcome Trust Sanger Institute
http://www.sanger.ac.uk/resources/software/dindel/
wget -r -np -nd ftp://ftp.sanger.ac.uk/pub4/resources/software/dindel -P dindel
- Pindel
svn checkout https://trac.nbic.nl/svn/pindel pindel
その他
- dbSNP VCF
ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606/VCF/v4.0/000-README.txt
ただし annovar のそれを使った方が楽なケースが多いと思う
- variationtoolkit
svn checkout http://variationtoolkit.googlecode.com/svn/trunk/ variationtoolkit-read-only
- vcftools
http://vcftools.sourceforge.net/
svn co https://vcftools.svn.sourceforge.net/svnroot/vcftools vcftools
- VarScan
Variant Detection in Massively Parallel Sequencing Data
- ExomeCNV
Availability: CRAN package "ExomeCNV"
http://cran.r-project.org/web/packages/ExomeCNV/index.html
2012/06/01にもアップデートしてる
ExomeCNV User Guide - Nelsonlab
https://secure.genome.ucla.edu/index.php/ExomeCNV_User_Guide
- exomeCopy
http://bioconductor.org/packages/release/bioc/html/exomeCopy.html
- CNVnator
http://sv.gersteinlab.org/cnvnator/
- CNAseg
http://www.compbio.group.cam.ac.uk/software.html
download
http://www.compbio.group.cam.ac.uk/Resources/CNAseg/CNAseg.rar
example data
http://www.compbio.group.cam.ac.uk/Resources/CNAseg/CNAseg_exampledata.rar
- GATK の資料
GATK documentation index
http://www.broadinstitute.org/gsa/gatkdocs/release/
Running the GATK for the first time - GSA
http://www.broadinstitute.org/gsa/wiki/index.php/Running_the_GATK_for_the_first_time
Best Practice Variant Detection with the GATK v3 - GSA
http://www.broadinstitute.org/gsa/wiki/index.php/Best_Practice_Variant_Detection_with_the_GATK_v3
Frequently Asked Questions - GSA
http://www.broadinstitute.org/gsa/wiki/index.php/Frequently_Asked_Questions
GATK resource bundle - GSA
http://www.broadinstitute.org/gsa/wiki/index.php/GATK_resource_bundle
- Bowtie2
http://bowtie-bio.sourceforge.net/bowtie2/index.shtml
- TopHat - A spliced read mapper for RNA-Seq
http://tophat.cbcb.umd.edu/
iGenome にあるゲノムとインデックスは bowtie2 のものにアップデートしているとウェブサイトに表記がある
http://tophat.cbcb.umd.edu/igenomes.html
- Cufflinks - Transcript assembly, differential expression, and differential regulation for RNA-Seq
http://cufflinks.cbcb.umd.edu/
- Bowtie2
http://bowtie-bio.sourceforge.net/bowtie2/index.shtml
- BFAST: Blat-like Fast Accurate Search Tool
http://sourceforge.net/apps/mediawiki/bfast/index.php?title=Main_Page
git clone git://bfast.git.sourceforge.net/gitroot/bfast/bfast
- IGV
http://www.broadinstitute.org/software/igv/
http://www.broadinstitute.org/software/igv/download
- jksrc のバイナリー
TruSeq Exome 関連
- ターゲットリシーケンスのためのカバレッジの最適化 http://www.illuminakk.co.jp/pdf/TN_Targeted_Resequencing.pdf
- Optimizing Coverage for Targeted Resequencing http://www.illumina.com/documents/products/technotes/technote_optimizing_coverage_for_targeted_resequencing.pdf
- TruSeq_exome_targeted_regions.hg19.chr.bed.gz => iCom だと表記が次のように異なっている TruSeq-Exome-Targeted-Regions-BED-file.gz
- TruSeqExome1.1_installer.tgz => iCom だと表記が次のように異なっている TruSeq Exome Run Quality scripts