论植物线粒体基因组的复杂性

植物线粒体(pMtDNA)复杂性概况

1. 相比于动物线粒体基因组的大小(10-20k),已知的pMtDNA大小变异非常剧烈,从190k-11Mb不等

2. 重复序列变异范围大,大片段结构变异很常见

3. pMtDNA中基因的SNP同义突变率很低,显著低于动物线粒体与核基因

4. 越来越多的证据表明:开花植物的pMtDNA并不一定是环状,而是以线性状态或者多种形式共存于细胞中,而且不同生长时期还能相互转变

5. 除了参与能量代谢,pMtDNA经常性与植物育性相关

6. 编码基因非常保守:24个核心保守基因+17个变异基因,但是保守基因的order可不保守哦,嘻嘻~

7. 经常可以注释到大量novel genes,部分基因的功能非常重要,影响植物生育周期与育性


1、眼见为实,有图有真相,颠覆认知

——真实pMtDNA六大物理形态


A)线性分支状

相互缠绕在一起的线性分子,在一侧会出现聚集,无法确定序列是否连接在一起

1.jpg


B)简单环状

最为常见、易于理解的pMtDNA状态,也是最容易组装获得完成图的形态

2.jpg


C)简单线性

线性分子,且无聚集现象,相对容易组装与分析

3.jpg


D)降解状

分子无明确形态,类似降解的DNA,分析几乎无解

4.jpg


E)彗星状

具有一个明显的分子聚集点,少量的线性分析与其连接

5.jpg

F)环状分枝状

线性的分子相互缠绕,形成多个环状结构

6.jpg

以生菜线粒体为例,检测近100张电镜图后,对各类形态进行了统计,发现A类最多。

笔者以前一直认为B类应该最多,不清楚该结论是否具有普适性,生物学处处让人意外啊!


7.jpg


有点晕,很复杂?来个更加复杂的!


2、pMtDNA分子的变体(isoform)多态性


以下不同isoform都来自于同一个样本的pMtDNA哦!

1)DR重组

同向重复序列(Direct Repeats)R和T元件之间发生重组,形成两种类型的isoforms

8.jpg

2)IR重组

反向重复序列(Inverted Repeats)两个T元件之间发生重组,形成两种类型的isoforms

9.jpg


3)重复序列重组

在短重复序列元件之间发生重组,一般中间的元件全部发生倒位


10.jpg

还没有结束哦

3、pMtDNA多isoforms共存性


pMtDNA六大物理特性的角度观察,isoforms在同一物种中可能存在多种情况(想想比例最高的A线性分支状分子吧)

如下是生菜样品pMtDNA的三种isoforms,其中中间形态比例最多,如果组装方法合理,那么该形态会被当作完成图序列。

而上下两种isoforms可能会丢失,但是在基因组共线性分析时可能会找到重组的线索(MW、WNZ和KNZ元件)。

11.jpg

4、

三代与三维基因组技术待完善


如果pMtDNA的分子形态只有B或者C,那么PacBio和Nanopore就能解决几乎所有pMtDNA的组装问题,然而现实是残酷的

  首先我们看PacBio数据在pMtDNA分子上的深度分布:对于完成图比较了解的研究人员都应该清楚,组装质量比较高的完成图用NGS或者PacBio去进行序列深度、覆盖度统计时,整个基因组上的深度应该比较均匀,但是从下图我们可以看到,由于重组事件的发生,不同元件上PacBio Reads的分布呈现明显的波动。这个波动不仅影响序列组装,另一方面也会影响连接关系的确认。

12.jpg

我们再看国际知名三维基因组测序公司DoveTail的Hi-C技术在pMtDNA上面的应用:相比于传统Mate Pair文库(在PacBio、Nanopore技术横行的今天,MP文库已经几乎进入历史的教科书中),Hi-C在进行连接关系的确认时,也只能将高丰度的分子元件进行连接,对于多种isoforms的情况也暂时无能为力。

13.jpg


总结



1. pMtDNA分子非常复杂,做好研究的心理准备

2. 随着三代与三维基因组技术的发展,未来必然能把各种isoforms全部获取,笔者非常有信心

3. 针对pMtDNA的深入研究,可以为研究植物基因组进化与基因组片段重组提供模型支持,加深人们对于植物重复序列元件的认识与理解

分享