BAM IdxStats(统计BAM具体比对信息)
分析模块,输入按坐标排序过的bam比对结果文件,建立索引,并统计比对结果中,参考基因组每条序列的具体比对信息。
关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。
输入:
坐标排序过的bam比对结果文件。
输出:
参考基因组每条序列的具体比对信息。
示例:
chr1 248956422 6039680 0
chr2 242193529 4663430 0
chr3 198295559 3836263 0
chr4 190214555 2749138 0
chr5 181538259 3051550 0
chr6 170805979 2918637 0
chr7 159345973 3114113 0
chr8 145138636 2338216 0
注:从左到右分别为,reference sequence name(参考基因组序列名称), sequence length(参考基因组序列长度), mapped reads(比对上的reads总数)和unmapped reads(比对不上的reads总数)
分析模块引用了SAMtools v0.1.19软件中的idxstats命令进行比对信息的统计(http://samtools.sourceforge.net/)。
相关文献如下所示:
Li H.*, Handsaker B.*, Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. and 1000 Genome Project Data Processing Subgroup (2009) The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics, 25, 2078-9. [PMID: 19505943]
Li H A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011 Nov 1;27(21):2987-93. Epub 2011 Sep 8. [PMID: 21903627]