read coverage per BED region(目标区域覆盖度统计)
分析模块,输入按坐标排序过的bam比对结果文件和bed区间信息文件,统计bed文件中,目标区间内比对结果的覆盖度信息。
关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。
关于BED格式的介绍,参考:(http://asia.ensembl.org/info/website/upload/bed.html)。
输入:
1、坐标排序过的bam比对结果文件。
2、bed区间信息文件。
示例:
chr1 2000 4000
chr2 13500 15000
chr3 23000 25000
输出:
bed文件内,每个区间内比对结果的覆盖度信息。
chr1 2000 4000 4251 2000 2000 1.0000000
chr2 13500 15000 3296 1500 1500 1.0000000
chr3 23000 25000 4365 2000 2000 1.0000000
注:
追加的第四列为,bed区间内比对上的reads总数
追加的第五列为,bed区间内,被覆盖到的碱基总数
追加的第六列为,bed区间长度
追加的第七列为,bed区间覆盖率,计算方式为:第五列的值除以第六列的值。
分析模块引用了bedtools v2-2.20.1软件中的coverage命令进行覆盖度信息的统计(http://bedtools.readthedocs.io/en/latest/)。
相关文献如下所示:
Quinlan AR and Hall IM, 2010. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 6, pp. 841–842.