BAM Flagstat(统计BAM比对结果)
分析模块,输入bam格式的比对结果文件,对整体输入数据的比对结果进行统计。
关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。
输入:
bam格式的比对结果文件。
输出:
比对结果统计信息。
示例:
20607872 + 0 in total (QC-passed reads + QC-failed reads) #reads总数。
0 + 0 duplicates #PCR duplication reads总数。
19372694 + 0 mapped (94.01%:-nan%) #reads比对率。
20607872 + 0 paired in sequencing #属于PE read的reads总数。
10301155 + 0 read1 #PE read中Read 1 的reads 总数。
10306717 + 0 read2 #PE read中Read 2 的reads 总数。
11228982 + 0 properly paired (54.49%:-nan%) #完美比对的reads总数。PE两端reads比对到同一条序列,且根据比对结果推断的插入片段大小符合设置的阈值。
18965125 + 0 with itself and mate mapped #PE两端reads都比对上参考序列的reads总数。
407569 + 0 singletons (1.98%:-nan%) #PE两端reads,其中一端比上,另一端没比上的reads总数。
3059705 + 0 with mate mapped to a different chr #PE read中,两端分别比对到两条不同的序列的reads总数。
1712129 + 0 with mate mapped to a different chr (mapQ>=5) #PE read中,两端分别比对到两条不同的序列,且mapQ>=5的reads总数。
分析模块引用了SAMtools v0.1.19软件中的flagstat命令进行比对结果的统计(http://samtools.sourceforge.net/)。
相关文献如下所示:
Li H.*, Handsaker B.*, Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. and 1000 Genome Project Data Processing Subgroup (2009) The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics, 25, 2078-9. [PMID: 19505943]
Li H A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011 Nov 1;27(21):2987-93. Epub 2011 Sep 8. [PMID: 21903627]