read depth per BED region(目标区域深度统计)
分析模块,输入按坐标排序过的bam比对结果文件和bed区间信息文件,统计bed文件中,目标区间内比对结果的深度信息。
关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。
关于BED格式的介绍,参考:(http://asia.ensembl.org/info/website/upload/bed.html)。
输入:
1、坐标排序过的bam比对结果文件。
2、bed区间信息文件。
示例:
chr1 2000 4000
chr2 13500 15000
chr3 23000 25000
输出:
bed文件内,每个区间内比对结果的深度信息。
示例:
chr1 2000 4000 287685 143.84
chr2 13500 15000 219340 146.23
chr3 23000 25000 294815 147.41
注:
追加的第四列为,bed区间内比对上的碱基总数。
追加的第五列为,bed区间内碱基的平均深度,计算方式为:第四列的值除以bed区间长度。
分析模块引用了SAMtools v0.1.19软件中的bedcov命令进行深度信息的统计(http://samtools.sourceforge.net/)。
相关文献如下所示:
Li H.*, Handsaker B.*, Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. and 1000 Genome Project Data Processing Subgroup (2009) The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics, 25, 2078-9. [PMID: 19505943]
Li H A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011 Nov 1;27(21):2987-93. Epub 2011 Sep 8. [PMID: 21903627]