目标区域覆盖度统计

read coverage per BED region(目标区域覆盖度统计)


  分析模块,输入按坐标排序过的bam比对结果文件和bed区间信息文件,统计bed文件中,目标区间内比对结果的覆盖度信息。

  关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。

  关于BED格式的介绍,参考:(http://asia.ensembl.org/info/website/upload/bed.html)。


  输入:

       1、坐标排序过的bam比对结果文件。

       2、bed区间信息文件。

  示例:

chr1   2000         4000

chr2   13500       15000

chr3   23000       25000


  输出:

       bed文件内,每个区间内比对结果的覆盖度信息。

chr1   2000         4000         4251         2000         2000         1.0000000

chr2   13500       15000       3296         1500         1500         1.0000000

chr3   23000       25000       4365         2000         2000         1.0000000

注:

追加的第四列为,bed区间内比对上的reads总数

追加的第五列为,bed区间内,被覆盖到的碱基总数

追加的第六列为,bed区间长度

追加的第七列为,bed区间覆盖率,计算方式为:第五列的值除以第六列的值。


  分析模块引用了bedtools v2-2.20.1软件中的coverage命令进行覆盖度信息的统计(http://bedtools.readthedocs.io/en/latest/)。


  相关文献如下所示:

Quinlan AR and Hall IM, 2010. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 6, pp. 841–842.


分享