细胞器基因组个性化分析实例
细胞器基因组研究,很多的研究报道以一个圆满的圈儿就结束了,比如,这样的……
或者这样的……
这样的一张细胞器基因组完成图,直观地展示了基因组结构、基因构成和GC含量等基本信息。
然而,这个圈儿并不是句点~~
首先,我们来看看无论在植物中还是动物中,无论是叶绿体研究还是线粒体研究中都可以开展的一些研究内容:
First, 比较基因组研究的内容,也是最常见的研究内容:对已知的基因组进行比较分析,用于了解基因的功能,表达机理及物种进化,通过基因和基因组结构的比较,可以阐释物种进化关系及基因组的内在结构,你会看见这样的:
或者这样的分析作图:
如18年发表在《International Journal of Molecular Sciences》上的四种菊科植物的叶绿体基因组研究中,就利用比较基因组的方法,直观展现了蒲公英科植物叶绿体基因组的序列多样性,也解释了4种植物叶绿体基因组大小差异的来源:
而在18年发表在《BMC Genomics》杂志的虎耳草科植物叶绿体基因组研究中[2],则通过比较基因组系统说明5种虎耳草植物的叶绿体基因组保守性。不仅限于此,通过IR区的扩张与收缩研究,可以获悉导致相关基因拷贝数的变化,或者导致边界区域假基因的产生,以此来描述造成不同谱系间叶绿体基因组大小差异的原因:
同时,比较参考基因组,也可以比较获得样本基因组中的SNP,InDel,SV等信息,当然这些信息除了便于我们统计各类标记的分布,也可以比较研究样本基因组与参考基因组的结构差异:
图例说明:
内圈是参考基因组,外圈是样品基因组。Collinear:同线性区域;Translocation:易位区域;Inversion:倒置区域;Tran+Inver:易位兼倒置的区域;Insertion:长度大于等于50bp的插入区域;Deletion:长度大于等于50bp的缺失区域;ComplexInDel:比对不上但位置相对应的区域;Forward_chain:基因组序列的正向链,此时基因坐标沿顺时针方向增大;Reverse_chain:基因组序列的反向链,此时基因坐标沿逆时针方向增大。
2018年《Scientific Reports》发表了五味子植物的叶绿体进化研究[3],就通过叶绿体基因组的SSR研究等,讨论了物种的动态演化过程:
可见,通过对序列信息的深入解析,就可以获得包括物种分类,系统进化,地理谱系遗传等信息——无论是动物还是植物,无论是叶绿体研究还是线粒体研究,都可以实现系统进化和选择压力的分析(下图来源于参考文献[3]):
除此以外,我们可以将所有样本中均存在的同源基因作为共有基因(Core gene),去掉共有基因后,得到非共有基因(Dispensable gene)。特有基因(Specific gene)为只有该样品特异拥有的基因。所有非共有基因与共有基因合并作为泛基因集(Pan gene)。其中共有基因(Core gene)和特有基因(Specific gene)很可能与样品的共性和特性相对应,可以作为样本间功能差异的研究依据:
U see? 叶绿体和线粒体基因组研究,圆满真的不止步在一个圆,透过各式各样的比较基因组分析,可以撰写出许多精彩绝伦的故事来。