BWA reference index(构建参考序列BWA比对索引)
分析模块,根据输入的参考序列文件(fasta格式),建立BWA比对索引文件,用于后续的BWA软件比对。
同时,也可以使用,预先构建好索引的序列文件。目前包含:人类hg19参考序列。
注:前者需提供序列文件,花费时间创建对应序列文件的BWA参考索引。后者直接使用预先创建好的序列索引。
输入:
fasta格式的参考序列文件。
示例:
>chr1
ATGCCTTCGCCATGTTGACGGGATCGTCCGCGACGGCAATCGCCGTATTCACTAACACCG
CGTCGGCCCCCATTTCCAGCGCCTGCGCGGCATGGCTGGGAACGCCGATGCCAGCATCGA
CAACCACCGGCACTGTGGCCTGCTGGATAATAATCTCCAGCATGGCGCGGGTTTCCAGTC
CCTGATTCGAGCCAATCGGCGCGCCGAGCGGCATCACCGCTGCACAGCCGACTTCTTCCA
GACGTTTACACAATACCGGATCGGCCCCGCAGTAAGGCAGCACGACAAATCCCTGTTGTA
>chr2
CCAGCGTTTCGGCGGCTTTCAGGGTTTCGATGGGATCGGGCAACAGCCAGCGGGCGTCAG
GGTGAATCTCTAATTTTAACCAGTTTGTGCCTAACGCTTCACGAGCCAGATGGGCGGCGA
AAATGGCTTCTTCCGCTGTTTTCGCCCCGGATGTATTTGGCAGCAGGGTCACACCCGCCG
CGATAAGCGGTTCGAGGATAGCGTCGTTGTGCTGGCGCAAGTCGACACGTTTCATCGCCA
GTGTCACCAGCTGGCTGCCGGAAGCGCGGATCGCCTCCACCATCAGTTGTGAAGAAGCGA
ATTTCCCTGTGCCGGTAAACAGATGTGAATCAAACGTTTTGTCCGCAATACGTAACATTT
CAACCCCCTGCAATAACCTGAAAAAGCAGGATCTGGTCGCCATCCTGCACGATATGTTGC
GCCCACTGCTCACGCGGGACGATTTGCTGATTAATCGCCAGAGCCGCGCCCGCTTGTCGT
输出:
包含构建好BWA索引的参考序列文件(fasta格式)。
注:假设输出为ref_index.fasta,则索引由以下后缀的文件组成,包含:
ref_index.dict
ref_index.fasta (fasta格式的参考序列文件)
ref_index.fasta.amb
ref_index.fasta.ann
ref_index.fasta.bwt
ref_index.fasta.fai
ref_index.fasta.pac
ref_index.fasta.sa
分析模块引用了BWA v0.7.12软件(http://bio-bwa.sourceforge.net/)。
相关文献如下所示:
Li H. and Durbin R. (2009) Fast and accurate short read alignment with Burrows-Wheeler Transform. Bioinformatics, 25:1754-60. [PMID: 19451168]
Li H. and Durbin R. (2010) Fast and accurate long-read alignment with Burrows-Wheeler Transform. Bioinformatics, Epub. [PMID: 20080505]