植物叶绿体基因组在基因顺序和基因含量方面都是高度保守的,并且具有较低的进化速率。在此,我们以五味子科为例,通过系统发育学分析,对叶绿体基因组的整体进化动力学进行深入了解,并建立了基于叶绿体基因组的五味子科的系统发育关系。
与其他高等植物相似,南五味子(Kadsura coccinea)的叶绿体基因组具有典型的四方结构,具有两个反向重复序列(IR,16,536bp),由一个小的单拷贝区域(SSC,18,040bp)和一个大的单拷贝区域(LSC,94,301bp)分开(下图)。相比参考基因组八角茴香(Illicium oligandrum,148,553 bp)的基因组小3.1 kb,比五味子(Schisandra chinensis)大0.8 kb。序列长度差异主要归因于基因间隔区长度的变化(下表)。
三种五味子科叶绿体基因组编码113个独特基因,包括79个蛋白质编码基因,30个tRNA基因和4个rRNA基因。其中,4个蛋白质编码基因,4个rRNA基因和5个tRNA基因在IR区域中重复;18个基因含有内含子,clpP和ycf3含有两个内含子;rps12中存在反式剪接,其中5'末端位于LSC区域中,并且重复的3'末端位于IR区域中;matK基因trnK-UUU内部。
SSR是叶绿体基因组中经常观察到的1-6bp重复类型,可用于基因组多态性以及物种的群体遗传学研究。研究人员鉴定到最丰富的SSR是A或T单核苷酸重复序列,分别占南五味子、五味子和八角茴香总SSR的约60.5%,56.8%和69%,而G或C重复罕见。此外,南五味子、五味子和八角茴香SSR的大多数SSR位于LSC区域,其次是SSC区域和IR区域(下图)。
同时,南五味子含有17个正向重复序列,16个回文重复序列和25个串联重复序列。 五味子包含30个正向重复序列,13个回文重复和25个串联重复。而八角茴香含有8个正向重复序列,21个回文重复和32个串联重复。 长度为30-40bp的重复最常见的(平均56.7%),切位于非编码区的重复比例高于编码区。
采用mVISTA和DnaSP程序分析叶绿体基因组水平的总体序列同一性,并检测五味子科叶绿体基因组中的不同区域(下图)。 结果表明,叶绿体基因组存在高度的共线性和基因顺序保守性,同时非编码区域的差异比编码区域更高。
IR的扩增和收缩导致各种植物谱系之间的基因组大小变化,可用于研究植物谱系的系统发育分类和基因组进化。与其他植物叶绿体谱系相比,五味子科中的IR具有10kb的收缩(下图)。IRa / SSC边界延伸到ycf1,导致三种Schisandraceae叶绿体基因组中的存在ycf1假基因。
叶绿体基因组序列已被广泛用于重建植物系统发育。研究中选取了66个植物分类群的82个蛋白质编码基因数据集(包括七种五味子科物种)进行系统发育分析的ML和BI方法。
Kadsura和Schisandra形成了单一的分支,并且是Illicium的姐妹。利用该数据集也建立了五种八角茴香物种之间的系统发育关系(下图)。
与核基因组相比,叶绿体基因组具有相对小的尺寸、单亲遗传、基因含量和顺序的保守性以及高拷贝数等特征。叶绿体基因组序列数据有助于推断与其他被子植物家族的骨架关系,以及解决物种的系统发育关系,是测试谱系特异性分子进化的良好模型。
参考文献
Dynamic evolution and phylogenomic analysis of the chloroplast genome in Schisandraceae. Scientific Reports, 2018.