VCF Restore Coordinate(VCF文件坐标还原)
分析模块,输入vcf变异信息文件和bed区间信息文件,将突变在目标序列上的坐标,还原成染色体上的坐标,并输出坐标还原后的vcf文件。
关于VCF格式的详细介绍,参考:(http://www.1000genomes.org/wiki/Analysis/variant-call-format/)。
输入:
1、vcf格式的变异信息文件。
示例:
#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT Sample_A1
chr1:2000-4000 88 . T C 1169.77 . AC=1;AF=0.500;AN=2;BaseQRankSum=1.332;DP=143;Dels=0.00;ExcessHet=3.0103;FS=0.617;HaplotypeScore=39.9093;MLEAC=1;MLEAF=0.500;MQ=48.22;MQ0=0;MQRankSum=-0.629;QD=8.18;ReadPosRankSum=-1.219;SOR=0.665 GT:AD:DP:GQ:PL 0/1:68,75:143:99:1198,0,1047
chr1:2000-4000 235 . C A 2939.77 . AC=2;AF=1.00;AN=2;BaseQRankSum=-1.433;DP=140;Dels=0.00;ExcessHet=3.0103;FS=0.000;HaplotypeScore=43.8028;MLEAC=2;MLEAF=1.00;MQ=50.17;MQ0=0;MQRankSum=-0.935;QD=21.15;ReadPosRankSum=1.558;SOR=0.333 GT:AD:DP:GQ:PL 1/1:1,138:140:99:2968,393,0
……
2、bed格式的区间信息文件。
示例:
chr1 2000 4000
chr2 13500 15000
chr3 23000 25000
输出:
坐标还原后的vcf文件。
示例:
#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT Sample_A1
chr1 2088 . T C 1169.77 . AC=1;AF=0.500;AN=2;BaseQRankSum=1.332;DP=143;Dels=0.00;ExcessHet=3.0103;FS=0.617;HaplotypeScore=39.9093;MLEAC=1;MLEAF=0.500;MQ=48.22;MQ0=0;MQRankSum=-0.629;QD=8.18;ReadPosRankSum=-1.219;SOR=0.665 GT:AD:DP:GQ:PL 0/1:68,75:143:99:1198,0,1047
chr1 2235 . C A 2939.77 . AC=2;AF=1.00;AN=2;BaseQRankSum=-1.433;DP=140;Dels=0.00;ExcessHet=3.0103;FS=0.000;HaplotypeScore=43.8028;MLEAC=2;MLEAF=1.00;MQ=50.17;MQ0=0;MQRankSum=-0.935;QD=21.15;ReadPosRankSum=1.558;SOR=0.333 GT:AD:DP:GQ:PL 1/1:1,138:140:99:2968,393,0
……