SMRT Sequencing of a Full-Length Transcriptome Reveals Transcript Variants Involved in C18 Unsaturated Fatty Acid Biosynthesis and Metabolism Pathways at Chilling Temperature in Pennisetum Giganteum. BMC Genomics, 2020.3.501
Abstract
Background: Pennisetum giganteum, an abundant, fast-growing perennial C4 grass that belongs to the genus Pennisetum, family Poaceae, has been developed as a source of biomass for mushroom cultivation and production, as a source of forage for cattle and sheep, and as a tool to remedy soil erosion. However, having a chilling-sensitive nature, P. giganteum seedlings need to be protected while overwintering in most temperate climate regions.
Results: To elucidate the cold stress responses of P. giganteum, we carried out comprehensive full-length transcriptomes from leaf and root tissues under room temperature (RT) and chilling temperature (CT) using PacBio Iso-Seq long reads. We identified 196,124 and 140,766 full-length consensus transcripts in the RT and CT samples, respectively. We then systematically performed functional annotation, transcription factor identification, long non-coding RNAs (lncRNAs) prediction, and simple sequence repeat (SSR) analysis of those full-length transcriptomes. Isoform analysis revealed that alternative splicing events may be induced by cold stress in P. giganteum, and transcript variants may be involved in C18 unsaturated fatty acid biosynthesis and metabolism pathways at chilling temperature in P. giganteum. Furthermore, the fatty acid composition determination and gene expression level analysis supported that C18 unsaturated fatty acid biosynthesis and metabolism pathways may play roles during cold stress in P. giganteum.
Conclusions: We provide the first comprehensive full-length transcriptomic resource for the abundant and fast-growing perennial grass Pennisetum giganteum. Our results provide a useful transcriptomic resource for exploring the biological pathways involved in the cold stress responses of P. giganteum.
Keywords: Alternative splicing; C18 unsaturated fatty acids; Chilling temperature; Full-length transcriptome; Pennisetum giganteum.
C4植物在世界农业中发挥着关键作用,如玉米和高粱等作物是世界粮食生产的主要贡献者。而C4草本植物,如巨菌草(Pennisetum giganteum),是生物能源的主要植物来源,具有极高的经济价值。然而,大多数C4植物对低温敏感。因此,通过三代全长转录组,对于探究P. giganteum对低温胁迫的响应机制具有重要的意义。
01研究设计
本文选取巨菌草(P. giganteum)幼苗种子,分成两组,即室温RT组(25℃)和低温胁迫CT组(4℃)进行培育。
02研究结果究结果
1、利用PacBio Iso-seq进行巨菌草(P. giganteum)转录组分析
利用PacBio IsoSeq对RT和CT的两个合并样本(来自叶和根组织)进行测序,以获得广泛的巨菌草全长转录组。RT样本共产生509,371个CCS reads,共产生558,634,435 bp。CT样本共产生371,590个CCS reads,共442,366,361 bp。在RT和CT样本中分别生成196,124和140,766个全长的一致转录本(表1),结合RT和CT数据,共生成336,890个转录本和319,926个unigenes。
2、组装好的转录本功能注释
为了获得一个全面的功能注释的P. giganteum转录本功能信息,比对了Nr、Nt、Swiss-Pro、GO、COG和KEGG数据库。
为了确定unigenes的潜在功能,GO注释表明,CT样本中注释到的unigenes (71,041)比RT样本(65,341)多。总的来说,我们观察到在RT和CT样本之间高度相似的GO功能分类(图1a)。为了鉴定加注释的P. giganteum生物途径,研究同时进行了KEGG中的参考途径(图1b)。与CT样本相比,RT中与“能量代谢”相关的unigenes的比例更高,而与“碳水化合物代谢”相关的unigenes比例较低。COG分类中,RT和CT样本中分别注释87,244和73,324个unigenes(图1c)。
综上所述,GO、KEGG和COG对unigenes的注释和分类结果使我们获得了P. giganteum CT和RT处理的全长转录组的全面功能表征。两种处理的转录本功能分类大体相似,说明转录组在通路水平上总体上是保守的,但CT和RT之间存在一些细微差异。
3、转录因子识别
在RT和CT样本中分别鉴定出4,974和5,170个推测的TF基因。在所有的TF家族中,C2H2家族在RT(391,7.86%)和CT样本(400,7.74%)中都是最多的。
4、LncRNA预测
通过CNCI、Pfam、PLEK和CPC蛋白结构域分析,预测数据集中的lncRNA。总之,四种方法在RT和CT样本中分别预测了18,461和12,701个≥200bp的候选lncRNA(图3a),lncRNA的长度分布如图3b所示,其中大部分为单亚型转录本(图3c))。这些lncRNA的功能需要进一步的鉴定。
5、Genic-SSR识别
P. giganteum转录本中含有大量的SSRs。总计从33,463个contigs中鉴定出39,309(12.29% unigen)个潜在的SSR,所有序列至少重复5次(从二到六核苷酸)。SSR位点的发生频率为全长unigene序列的1/17.6 kb。在所有重复类型中,SSRs的长度分布在12 ~ 140 bp之间,平均为16.61 bp。
6、基因可变剪接检测
Iso-Seq的一个优点是能够在全转录组尺度上描述可变剪接的复杂性。研究将非冗余转录本进一步划分为转录家族,并将每个家族重建为一个或多个全长独特的转录模型(UniTransModel)。总计,RT和CT样本分别获得63,696和48,102个全长UniTransModels(图5a)。
将UniTransModels作为参考来确定可选的拼接事件。在RT和CT样本中识别出6,571和8,088个基于UniTransModels的可变剪接。图5b所示为两个具有可变剪接事件的样本的转录亚型数。值得注意的是,CT样本中有两种或更多亚型的UniTransModels的占比均高于RT样本。这些结果表明,在P. giganteum中可能存在低温胁迫诱导的可变剪接事件。
7、可变剪接基因参与α-亚麻酸生物合成和代谢通路
十八碳不饱和脂肪酸在植物抗寒反应中起着重要作用。通过KEGG注释,研究确定了α-亚麻酸代谢途径中RT样本中12个相关基因和CT样本14个相关基因,并且可变剪接事件。此外,在RT和CT样本中,这些基因中可能具有不同的转录亚型。例如,RT样本中有4种亚型,包括乙酰-CoA水合酶/3-羟基酰基-CoA脱氢酶基因MFP2;而在CT样本中有9种亚型(图6a和b)。
这些结果表明,P. giganteum中α-亚麻酸生物合成和代谢途径的基因中的可变剪接事件可能会被低温诱导。
8、低温胁迫下P. giganteum叶片的C18不饱和脂肪酸含量增加
采用气相色谱法测定了P. giganteum叶片在低温胁迫下的脂肪酸组成。棕榈酸(16:0)、硬脂酸(18:0)和油酸(18:1)含量在低温胁迫下逐渐降低,而亚油酸(18:2)和α-亚麻酸(18:3)的含量显著增加(图7 a-e)。在低温胁迫下,P. giganteum叶片的脂肪酸不饱和度逐渐升高(图7f)。这些结果表明,P. giganteum在低温胁迫下,不饱和脂肪酸生物合成途径被激活。
9、低温胁迫下α-亚麻酸生物合成和代谢通路基因的差异表达
为了进一步研究P. giganteum在低温胁迫中基因表达,研究测定了P. giganteum在低温胁迫和室温下的DEGs。在低温胁迫2、8和24h,分别检测到17,134、26,266和19,908个DEGs(图8)。低温胁迫下,α-亚麻酸生物合成基因差异表达都上调。因此,α-亚麻酸生物合成和代谢通路基因在P. giganteum的低温胁迫反应中可能扮演了一个重要的角色。
03总结
本研究对巨菌草(P. giganteum)对低温胁迫的响应进行了深入的全长转录组分析。我们的研究结果在RT和CT上系统地描述了P. giganteum的转录组信息,并揭示了P. giganteum在低温条件下C18不饱和脂肪酸的生物合成和代谢途径可能涉及的转录本以及可变剪切,进一步扩展了我们对C4禾本科植物的低温胁迫响应的认识。