全长转录组揭示巨菌草(Pennisetum giganteum)低温胁迫下生物合成和代谢途径变异

SMRT Sequencing of a Full-Length Transcriptome Reveals Transcript Variants Involved in C18 Unsaturated Fatty Acid Biosynthesis and Metabolism Pathways at Chilling Temperature in Pennisetum Giganteum. BMC Genomics, 2020.3.501

Abstract

Background: Pennisetum giganteum, an abundant, fast-growing perennial C4 grass that belongs to the genus Pennisetum, family Poaceae, has been developed as a source of biomass for mushroom cultivation and production, as a source of forage for cattle and sheep, and as a tool to remedy soil erosion. However, having a chilling-sensitive nature, P. giganteum seedlings need to be protected while overwintering in most temperate climate regions.

Results: To elucidate the cold stress responses of P. giganteum, we carried out comprehensive full-length transcriptomes from leaf and root tissues under room temperature (RT) and chilling temperature (CT) using PacBio Iso-Seq long reads. We identified 196,124 and 140,766 full-length consensus transcripts in the RT and CT samples, respectively. We then systematically performed functional annotation, transcription factor identification, long non-coding RNAs (lncRNAs) prediction, and simple sequence repeat (SSR) analysis of those full-length transcriptomes. Isoform analysis revealed that alternative splicing events may be induced by cold stress in P. giganteum, and transcript variants may be involved in C18 unsaturated fatty acid biosynthesis and metabolism pathways at chilling temperature in P. giganteum. Furthermore, the fatty acid composition determination and gene expression level analysis supported that C18 unsaturated fatty acid biosynthesis and metabolism pathways may play roles during cold stress in P. giganteum.

Conclusions: We provide the first comprehensive full-length transcriptomic resource for the abundant and fast-growing perennial grass Pennisetum giganteum. Our results provide a useful transcriptomic resource for exploring the biological pathways involved in the cold stress responses of P. giganteum.

Keywords: Alternative splicing; C18 unsaturated fatty acids; Chilling temperature; Full-length transcriptome; Pennisetum giganteum.

C4植物在世界农业中发挥着关键作用,玉米和高粱等作物是世界粮食生产的主要贡献者C4本植物巨菌草(Pennisetum giganteum)是生物能源的主要植物来源具有极高的经济价值。然而,大多数C4植物对低温敏感。因此,通过三代全长转录组,对于探究P. giganteum对低温胁迫的响应机制具有重要的意义。

01研究设计

本文选取巨菌草(P. giganteum)幼苗种子,分成两组,即室温RT组(25℃)和低温胁迫CT组(4℃)进行培育。

收集RT组中巨菌草幼苗根、叶组织样本,以及CT2824h的根、叶组织样本,构建Iso-Seq文库,进行Pacbio全长转录组测序。

02研究结果结果

1利用PacBio Iso-seq进行巨菌草(P. giganteum)转录组分析

利用PacBio IsoSeqRTCT的两个合并样本来自叶和根组织进行测序,以获得广泛的巨菌草全长转录组。RT样本共产生509,371CCS reads,共产生558,634,435 bpCT样本共产生371,590CCS reads,共442,366,361 bp。在RTCT样本中分别生成196,124140,766个全长的一致转录本(表1),结合RTCT数据,共生成336,890个转录本和319,926unigenes


2组装好的转录本功能注释

为了获得一个全面的功能注释的P. giganteum转录本功能信息,比对了NrNtSwiss-ProGOCOGKEGG数据库

为了确定unigenes的潜在功能,GO注释表明,CT样本中注释到的unigenes (71,041)RT样本(65,341)多。总的来说,我们观察到在RTCT样本之间高度相似的GO功能分类(图1a。为了鉴定加注释的P. giganteum生物途径,研究同时进行了KEGG中的参考途径(图1b。与CT样本相比,RT中与能量代谢相关的unigenes的比例更高,而碳水化合物代谢相关的unigenes比例较低。COG分类RTCT样本中分别注释87,24473,324unigenes(1c)

综上所述,GOKEGGCOGunigenes的注释和分类结果使我们获得了P. giganteum CTRT处理的全长转录组的全面功能表征。两种处理的转录本功能分类大体相似,说明转录组在通路水平上总体上是保守的,但CTRT之间存在一些细微差异。

1 P. giganteum组装转录组在RTCT下的功能注释和分类。a. CTRT标本中注释的unigenesGO分类。b. RTCT标本中标注的unigenesKEGG分类。c. CTRT样品中推测蛋白的COG分类

3转录因子识别

RTCT样本中分别鉴定出4,9745,170个推测的TF基因。在所有的TF家族中,C2H2家族在RT391,7.86%CT样本400,7.74%中都是最多的。

2 P. giganteum组装转录组在RTCTTF基因家族统计

4LncRNA预测

通过CNCIPfamPLEKCPC蛋白结构域分析,预测数据集中的lncRNA。总之,四种方法在RTCT样本中分别预测了18,46112,701≥200bp的候选lncRNA3a),lncRNA的长度分布如图3b所示,其中大部分为单亚型转录本3c)。这些lncRNA的功能需要进一步的鉴定。

3 P. giganteum lncRNA的鉴定。a. CNCICPCPfamPLEK预测的lncRNA数量Vennb. 已识别lncRNARTCT标本中的长度分布。c. lncRNARTCT标本中亚型数的分布

5Genic-SSR识别

P. giganteum转录中含有大量的SSRs。总计从33,463contigs中鉴定出39,30912.29% unigen个潜在的SSR,所有序列至少重复5从二到六核苷酸SSR位点的发生频率为全长unigene序列的1/17.6 kb。在所有重复类型中,SSRs的长度分布在12 ~ 140 bp之间,平均为16.61 bp


4 P. giganteum RTCT联合转录组中二核苷酸(a)、三核苷酸(b)和四核苷酸(c)重复序列中不同基序的百分比


6基因可变剪接检测

Iso-Seq的一个优点是能够在全转录组尺度上描述可变剪接的复杂性。研究将非冗余转录本进一步划分为转录家族,并将每个家族重建为一个或多个全长独特的转录模型UniTransModel。总计,RTCT样本分别获得63,69648,102个全长UniTransModels(图5a

UniTransModels作为参考来确定可选的拼接事件。在RTCT样本中识别出6,5718,088个基于UniTransModels的可变剪接。图5b所示为两个具有可变剪接事件的样本的转录亚型数。值得注意的是,CT样本中有两种或更多亚型的UniTransModels的占比均高于RT样本。这些结果表明,在P. giganteum中可能存在低温胁迫诱导的可变剪接事件。

5 利用Iso-Seq分析P. giganteum全长转录组的可变剪切亚型

7可变剪接基因参与α-亚麻酸生物合成和代谢通路

十八碳不饱和脂肪酸在植物抗寒反应中起着重要作用。通过KEGG注释,研究确定α-亚麻酸代谢途径中RT样本中12个相关基因CT样本14个相关基因,并且可变剪接事件。此外,在RTCT样本中,这些基因中可能具有不同的转录亚型。例如,RT样本中有4种亚型,包括乙酰-CoA水合酶/3-羟基酰基-CoA脱氢酶基因MFP2而在CT样本中有9种亚型6ab

这些结果表明P. giganteumα-亚麻酸生物合成和代谢途径的基因中的可变剪接事件可能会被低温诱导。

6 基因可变剪接参与α-亚麻酸生物合成和代谢通路。P. giganteum MFP2基因在RT (a)CT (b)标本中的不同亚型。对于每种亚型,蓝色的块表示外显子,中间的线表示内含子。

8低温胁迫下P. giganteum叶片的C18不饱和脂肪酸含量增加

采用气相色谱法测定了P. giganteum叶片在低温胁迫下的脂肪酸组成。棕榈酸(16:0)、硬脂酸(18:0)和油酸(18:1)含量低温胁迫下逐渐降低而亚油酸(18:2)α-亚麻酸(18:3)的含量显著增加7 a-e。在低温胁迫下,P. giganteum叶片的脂肪酸不饱和度逐渐升高7f。这些结果表明,P. giganteum低温胁迫下,不饱和脂肪酸生物合成途径被激活。

7 P. giganteum叶片在低温胁迫下的脂肪酸含量

9低温胁迫下α-亚麻酸生物合成和代谢通路基因的差异表达

为了进一步研究P. giganteum低温胁迫基因表达研究测定了P. giganteum低温胁迫室温下的DEGs在低温胁迫2824h,分别检测到17,13426,26619,908DEGs(图8低温胁迫下,α-亚麻酸生物合成基因差异表达都上调。因此,α-亚麻酸生物合成和代谢通路基因在P. giganteum低温胁迫反应可能扮演了一个重要的角色。

8 P. giganteum低温胁迫下α-亚麻酸生物合成和代谢通路基因差异表达

03总结

研究对巨菌草(P. giganteum对低温胁迫的响应进行了深入的全长转录组分析。我们的研究结果在RTCT上系统地描述了P. giganteum的转录组信息,并揭示了P. giganteum在低温条件下C18不饱和脂肪酸的生物合成和代谢途径可能涉及转录本以及可变剪切,进一步扩展了我们对C4禾本科植物的低温胁迫响应的认识。

分享