统计BAM具体比对信息

BAM IdxStats(统计BAM具体比对信息)


  分析模块,输入按坐标排序过的bam比对结果文件,建立索引,并统计比对结果中,参考基因组每条序列的具体比对信息。

  关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。


  输入:

  坐标排序过的bam比对结果文件。


  输出:

  参考基因组每条序列的具体比对信息。

  示例:

chr1   248956422       6039680   0

chr2   242193529       4663430   0

chr3   198295559       3836263   0

chr4   190214555       2749138   0

chr5   181538259       3051550   0

chr6   170805979       2918637   0

chr7   159345973       3114113   0

chr8   145138636       2338216   0

  注:从左到右分别为,reference sequence name(参考基因组序列名称), sequence length(参考基因组序列长度),   mapped reads(比对上的reads总数)和unmapped reads(比对不上的reads总数)


  分析模块引用了SAMtools v0.1.19软件中的idxstats命令进行比对信息的统计(http://samtools.sourceforge.net/)。


  相关文献如下所示:

Li H.*, Handsaker B.*, Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. and 1000 Genome Project Data Processing Subgroup (2009) The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics, 25, 2078-9. [PMID: 19505943]

Li H A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011 Nov 1;27(21):2987-93. Epub 2011 Sep 8. [PMID: 21903627]

分享