全基因组重测序是对已有参考序列(Reference Sequence)的物种的不同个体进行基因组测序,并以此为基础进行个体或群体水平的差异性分析。通过全基因组重测序,研究者可以找到大量的单核苷酸多态性位点(SNP)、拷贝数变异(Copy Number Variation,CNV)、插入缺失(InDel,Insertion/Deletion)、结构变异(Structure Variation,SV)等变异位点。这在人类疾病及动植物育种研究等方面具有重大的指导意义。
平台将构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,帮助客户在全基因组水平上扫描并检测与重要性状相关的基因序列差异和结构变异,实现遗传进化分析及重要性状候选基因预测,具有重大的科研和产业价值。
技术路线
服务内容
1. 测序
提取基因组DNA,进行片段化,电泳回收所需长度的DNA片段(0.2~0.5Kb),加上接头, 进行cluster制备,最后利用Paired-End(Solexa)的方法对插入片段进行重测序。
2. 数据处理
测序完成后,经过滤接头等污染后获得的reads,比对到参考基因组上,进行测序深度、覆盖度及均一性等产出数据的质量评估。
测序深度(Sequencing Depth)
测序得到的碱基总量(bp)与基因组大小(Genome)的比值,它是评价测序量的指标之一。测序深度与基因组覆盖度之间是一个正相关的关系,测序带来的错误率或假阳性结果会随着测序深度的提升而下降。重测序的个体,如果采用的是Paired-End或Mate-Pair方案,当测序深度在10~15X以上时,基因组覆盖度和测序错误率控制均得以保证。
测序深度对基因组覆盖度和测序错误率的影响(HOM:纯合体 HET:杂合体)
标准数据分析
· 一致性序列组装
与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。
· SNP检测及在基因组中的分布
提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基因组序列对检测到的变异进行注释。
· InDel检测及在基因组的分布
在进行mapping的过程中,进行容Gap的比对并检测可信的Short InDel。在检测过程中,Gap的长度为1~5个碱基。
· Structure Variation检测及在基因组中的分布
目前能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进进行注释。
样品要求
· 样品纯度:OD 260/280值应在1.8~2.0 之间;RNA 应该去除干净。
· 样品浓度:最低浓度不低于50ng/µl。
· 样品总量:每个样品总量不少于15µg。
· 样品溶剂:要溶解在H20或TE (pH 8.0)中。
· 样品运输: DNA低温运输(-20℃);且在运输过程中请用parafilm将管口密封好,以防出现污染。