目标区域深度统计

read depth per BED region(目标区域深度统计)


  分析模块,输入按坐标排序过的bam比对结果文件和bed区间信息文件,统计bed文件中,目标区间内比对结果的深度信息。

  关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。

  关于BED格式的介绍,参考:(http://asia.ensembl.org/info/website/upload/bed.html)。


  输入:

       1、坐标排序过的bam比对结果文件。

       2、bed区间信息文件。

  示例:

chr1   2000         4000

chr2   13500       15000

chr3   23000       25000


  输出:

       bed文件内,每个区间内比对结果的深度信息。

  示例:

chr1   2000         4000         287685     143.84

chr2   13500       15000       219340     146.23

chr3   23000       25000       294815     147.41

注:

追加的第四列为,bed区间内比对上的碱基总数。

追加的第五列为,bed区间内碱基的平均深度,计算方式为:第四列的值除以bed区间长度。


  分析模块引用了SAMtools v0.1.19软件中的bedcov命令进行深度信息的统计(http://samtools.sourceforge.net/)。


  相关文献如下所示:

Li H.*, Handsaker B.*, Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. and 1000 Genome Project Data Processing Subgroup (2009) The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics, 25, 2078-9. [PMID: 19505943]

Li H A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011 Nov 1;27(21):2987-93. Epub 2011 Sep 8. [PMID: 21903627]



分享