细胞器基因组专刊(一)叶绿体&线粒体联合分析

叶绿体&线粒体联合分析



背景介绍


1. 莱茵衣藻(Chlamydomonas reintmrdtii)是单细胞、带鞭毛的真核生物,隶属于绿藻门团藻目衣藻属。

2. 衣藻因其培养条件简单、生长周期短、生长迅速、光合效率高而具有“光合酵母”之称。

3. 衣藻具有核染色体、叶绿体和线粒体等3套基因组。

4. 叶绿体基因组特殊:205kb,显著大于其他常见植物(~150kb的叶绿体基因组)。

5. 线粒体基因组特殊:线性化的15.8kb分子,显著小于其他植物线粒体,且不属于环形基因组。

拟解决的科学问题——

1. 衣藻具有光合效率高和生长代谢快的特点,其叶绿体、线粒体基因组是否存在特殊性?

2. 已有报道的衣藻细胞器基因组是否正确?

3. 细胞器基因的转录能力是否与核基因存在差异?

4. 不同来源的衣藻细胞器基因的表达存在什么样的差异?

5. 衣藻细胞器基因转录时是否存在编辑现象?


上述问题看似复杂,但只要有合理的实验设计与分析,就可以获得答案,请看如下分解!联合分析?


2.jpg

修正NCBI公布的莱茵衣藻线粒体及叶绿体基因组

1. NCBI上公布的序列未必100%正确,尤其是早期报道的单纯使用NGS技术组装的基因组;

2. 当研究者通过各类实验发现明显的序列错误时,可以通过序列的重组装分析,对已有基因组进行位点矫正与重新拼接。

该项工作费时费力,但高质量的基因组组装结果,才是后期新的发现与预期结果等分析的基础。

3. 研究者使用如下策略对CP和Mito基因组进行修正:

(1)原始数据比对到核基因组,获得Unmapping的reads

(2)使用Ray对Unmapping的reads进行de novo组装

(3)将获得的scaffold序列与老版本基因组进行比较,使用IGV可视化工具逐一修正(手工操作,工作量巨大,但是相比于软件分析,此结果显然更加可靠!)


3.png


(4)修正状态——NCBI序列错误不少哦!

叶绿体:1个2.4kb的倒位,18个SNVs和22个InDels

线粒体:11个SNVs和12个InDels


修正后的叶绿体基因组:

4.jpg


修正后的线粒体-线性基因组:

5.jpg


细胞器基因组的拷贝数

在癌症细胞研究中,线粒体拷贝数相对于核基因组的比例是判断一个细胞是否属于癌症细胞的重要指标。

在植物细胞中,尤其类似衣藻这种代谢效率特别高的物种,其细胞器拷贝数是否异于其他物种,是一个非常有趣的话题。

研究者依靠修正SNVs使用的NGS数据计算三个基因组上mapping的reads,然后使用HmmCopy方法,结合基因组GC含量信息,计算获得细胞器基因组的拷贝数。发现衣藻线粒体拷贝数显著高于叶绿体的拷贝数,这与其他植物物种中两者相对接近的结果迥异。

6.jpg


细胞器基因转录情况调查

很多研究者都想了解叶绿体、线粒体上基因的表达,但是既往研究中使用的常规建库方法可能一直都存在问题!

7.jpg

基于本研究的结果,建议老师使用去除rRNA的建库方式,也就是类似lncRNA的建库方法对细胞器转录组开展研究。

本文中使用常规mRNA方法与去除rRNA方法同时研究细胞器、核基因组的mRNA表达情况,结果如下:

(a)DNA水平下,Reads的占比情况,与拷贝数一致;

(b)常规mRNA建库方式获得的Reads占比

(c)去除rRNA方式获得的Reads占比

很明显:根据既往经验与生物学常识,常规mRNA方法并不适合检测细胞器基因组的转录。具体原因在于很多细胞器基因并不具有严格的基因转录结构,而是类似原核生物基因,具有多顺反子的特性。因此,类似原核转录组的实验手段会更加适用于细胞器基因的转录研究。

该结论也是本文的重要亮点之一!

8.jpg

可以发现:核基因在不同实验方法下测定的表达情况相关性较高,但是叶绿体和线粒体的表达情况在不同方法间存在显著差异。


9.jpg

研究者对12种环境处理下的细胞器基因表达情况进行了分析,发现:

细胞器基因组上的基因表达与核基因组上的靶基因表达模式非常一致,说明去除rRNA建库的方法计算的表达量更为准确。

10.jpg


细胞器基因转录特性分析

(1)可变剪切

精通细胞器基因组分析的老师都会对psaA、psbA等基因深恶痛绝,因为单纯依靠基因组信息去鉴定该类多外显子基因需要非常深厚的经验,有时即使是经验丰富的生物信息分析人员也会出错。该文章建议使用转录组数据对这类多外显子基因进行注释,发现这种基因存在多种剪切类型,如下所示。分析人员可以根据各种情况的Reads丰度,挑选比例最高的注释版本进行后续分析,并上传NCBI。

11.jpg

(2)叶绿体基因无RNA编辑现象

RNA编辑是指在mRNA水平上改变遗传信息的过程。具体说来,指基因转录产生的mRNA分子中,由于核苷酸的缺失,插入或置换,基因转录物的序列不能与基因模板序列互补,使翻译生成的蛋白质的氨基酸组成,不同于基因序列中的编码信息现象。

既往研究中发现RNA编辑在真核生物中普遍存在,且在细胞器基因转录过程中也存在。但是本研究中却没有发现这种现象,考虑到转录组建库方式的独特性,本文的结果理论上更为可靠。

五、比较基因组分析

比较基因组用于研究进化关系是这类研究中常见的内容,几乎所有的细胞器基因组文章都会涉及。将获得的细胞器基因组与NCBI已有的基因组进行比较,鉴定SNPs,然后构建进化树,目的在于明确样品之间的亲缘关系。

当然,相比于常规的研究,本文还计算了细胞器基因组与核基因组的随机变异频率,发现核基因的突变频率显著高于细胞器基因,大约是后者的10倍。

这一点其实非常容易理解,正是因为叶绿体、线粒体基因的高度保守性,才会有那么多的研究者使用叶绿体基因组做分类研究,使用线粒体基因组进行生物Barcoding分析。

12.jpg


分享