Clean VCF file for BSA Analysis
分析模块,输入包含两个混池样品变异信息的VCF文件(混池间的个体性状存在极端差异),过滤VCF文件中,大于2个等位基因的位点和分型存在缺失的位点。
过滤后的VCF结果文件,其中的变异信息用于计算两个混池样品的SNP-Index。在后续的BSA分析中,SNP-Index用于确定候选区域。
关于VCF格式的详细介绍,参考:(http://www.1000genomes.org/wiki/Analysis/variant-call-format/)。
输入:
需要过滤的vcf文件。
输出:
1、过滤后的vcf结果文件。
2、包含所有染色体名称的列表文件。
示例:
Chr01
Chr02
Chr03
Chr04
Chr05
Chr06
Chr07
Chr08
Chr09
Chr10
Chr11
scaffold4
scaffold51
scaffold227
scaffold159
scaffold191