叶绿体基因组(cpDNA)在大多数种子植物中是母系遗传,与核基因组相比,cpDNA显示出致密的基因含量和较慢的进化速率。
楝科(Meliaceae)属于蔷薇亚纲无患子目,主要由广泛分布在热带地区得乔木和灌木组成。楝科植物具有极高的经济价值,应用叶绿体基因组开发木材种属鉴定的遗传标记具有很大的研究价值。
对Cedrela odorata,Entandrophragma cylindricum,Khaya senegalensis和Carapa guianensi四种楝科的叶绿体基因组进行测序组装,cpDNA呈环状,大小在158,558~160,737 bp之间,典型的四分体结构,即由两个反向重复序列组成(IRa和IRb),分别由大(LSC)和小(SSC)单拷贝区分开(下表)。
四个新测序的楝科植物的每个cpDNA中,注释了112个基因(包括78个蛋白质编码,30个tRNA和4个rRNA基因),其中18个在IR区域中重复,总共编码85种蛋白质,37种tRNA和8种rRNA共130种基因。内含子大小范围从trnL-UAA的532bp到trnK-UUU的2535bp。rps12基因存在反式剪接(下表)。
新测序的楝科植物(Cedrela odorata)基因图谱见下图。与已发表的印度楝(KF986530.1)质体基因组相比,这四个物种cpDNA基因含量和基因顺序几乎相同,不同之处在于IRa / SSC边界处的ycf1基因未注释为假基因;18个独特的基因被注释为在四个新测序的楝科物种中包含内含子;而在印度楝(Azadirachta indica)中的petD和rps12基因的中缺少内含子。
Cedrela odorata(MG724915)叶绿体基因组的基因图谱。灰色箭头表示两条DNA链的转录方向。内圈表示GC含量(50%阈值)。
为了研究楝科植物基因组序列的多样性,MVista共线性表明,这四种新测序的cpDNA与印度楝树(Azadirachta indica)相比相似性较低,基因间区域和rpl16内含子(LSC)存在大的缺失。共有序列比对表明以下区域显示出最高的变异频率:1-10,000bp,具有923个可变位置(top1); 120,000-130,000 bp,771个位置(top2); 130,000-140,000 bp,13,000个位置(top3)。top1区域位于LSC的5个主要部分,包括psbA, matK,rps16, psbK和psbI。top2-和top3-区域连接并代表ndhF下游的SSC、SSC / IRb边界。
以无患子科Acer buergerianum为外群的系统发育树显示4种新的楝科是印度楝(Azadirachta indica)的单系姊妹进化枝。在这个分支内,Cedrela odorata和Entandrophragma cylindricum聚类在一起,Khaya senegalensis和Carapa guianensis聚类到一起。
那么楝科叶绿体基因组标签区(Barcoding Region)存在哪些潜在的特异性cpDNA变异?这些变异有何意义?
文章选取了五种楝科植物和五种非楝科物种(无患子目和蔷薇亚纲)cpDNA的matK基因(cpDNA保守基因之一,用于遗传条码)进行比较分析,旨在鉴定潜在的楝科。鉴定了16个SNP位置,其中五个楝科个体显示相同的核苷酸,其与相同位置的非楝科物种的核苷酸不同。
在从GenBank下载的100个楝科物种的matK基因,序列多重比对进一步分析这16个SNP位置。其中三个SNP位于matK基因的3’-末端,编码C-末端与线粒体II内含子的结构域X同源的结构域,并且与N-末端区域相比具有更高的碱性氨基酸。潜在的楝科特异性SNP的进一步验证对木材或木制品的分类学差异具有很大意义。
文章展示了植物叶绿体基因组研究经典思路,值得借鉴。
首先,确定基因组结构,基因和区域(IR)的扩张与收缩;
其次,通过比较基因组研究序列多样性和进化关系;
最后,根据保守标签基因结构SNP研究物种遗传标记。
参考文献
Complete Chloroplast Genome Sequences of Four Meliaceae Species and Comparative Analyses. Int J Mol Sci, 2018.