胶质瘤中RNA结合蛋白的综合分析

Integrated Analysis of RNA-Binding Proteins in Glioma6.162

Cancers (Basel) . 2020 Apr 7;12(4):892. doi: 10.3390/cancers12040892.

Abstract

RNA-binding proteins (RBPs) play important roles in many cancer types. However, RBPs have not been thoroughly and systematically studied in gliomas. Global analysis of the functional impact of RBPs will provide a better understanding of gliomagenesis and new insights into glioma therapy. In this study, we integrated a list of the human RBPs from six sources-Gerstberger, SONAR, Gene Ontology project, Poly(A) binding protein, CARIC, and XRNAX-which covered 4127 proteins with RNA-binding activity. The RNA sequencing data were downloaded from The Cancer Genome Atlas (TCGA) (n = 699) and Chinese Glioma Genome Atlas (CGGA) (n = 325 + 693). We examined the differentially expressed genes (DEGs) using the R package DESeq2, and constructed a weighted gene co-expression network analysis (WGCNA) of RBPs. Furthermore, survival analysis was also performed based on the univariate and multivariate Cox proportional hazards regression models. In the WGCNA analysis, we identified a key module involved in the overall survival (OS) of glioblastomas. Survival analysis revealed eight RBPs (PTRF, FNDC3B, SLC25A43, ZC3H12A, LRRFIP1, HSP90B1, HSPA5, and BNC2) are significantly associated with the survival of glioblastoma patients. Another 693 patients within the CGGA database were used to validate the findings. Additionally, 3564 RBPs were classified into canonical and non-canonical RBPs depending on the domains that they contain, and non-canonical RBPs account for the majority (72.95%). The Gene Ontology (GO) and Kyoto Encyclopedia of Genes and Genomes (KEGG) pathway analysis showed that some non-canonical RBPs may have functions in glioma. Finally, we found that the knockdown of non-canonical RBPs, PTRF, or FNDC3B can alone significantly inhibit the proliferation of LN229 and U251 cells. Simultaneously, RNA Immunoprecipitation (RIP) analysis indicated that PTRF may regulate cell growth and death- related pathways to maintain tumor cell growth. In conclusion, our findings presented an integrated view to assess the potential death risks of glioblastoma at a molecular level, based on the expression of RBPs. More importantly, we identified non-canonical RNA-binding proteins PTRF and FNDC3B, showing them to be potential prognostic biomarkers for glioblastoma.

Keywords: RIP-seq; RNA-binding protein; WGCNAs; glioma; non-canonical RBP; prognosis; survival.

数据和方法

数据集
研究中使用的人类RBPs整理自以下6个数据库:Gerstberger, SONAR, the Gene Ontology project, Poly(A)-binding protein, CARIC和XRNAX;下载的数据集有TCGA数据库中699名患者的转录组数据,以及CGGA中包含325个样本的RNA-seq数据(ID是mRNAseq_325);在生存分析时,用到了138名GBM患者的临床信息,其中54名为复发性和继发性;此外,CGGA中205个新样本的生存和临床数据被用来验证研究结果。
方法
富集分析

作者根据RBPs的结构域是否得到证实将它们分为标准(canonical)RBPs和非标准(non-canonical)RBPs两组,结构域信息来源是Pfam数据库;用DAVID做了GO和KEGG的富集分析以及可视化等分析。

WGCNA分析

作者从TCGA获得了包含3564个RBPs的表达谱,然后用R包WGCNA构建了一个共表达网络。首先,基于RBPs表达谱,将胶质瘤样本按照不同的临床特征进行层次聚类;然后,根据RBPs间的皮尔森相关系数筛选软阈值β,来确保网络的无标度性,这里β6;根据TOM这一相似性量度,研究通过AL层次聚类法(组间距离等于两组对象之间的平均距离)将表达相似的RBPs聚到了同一模块。接下来,文中定义了两个参数MEsGS, MEs代表第一个主成分相关的模块,它的值代表模块中的所有基因,GS表示基因和临床性状之间的相关性,用于量化单个基因与感兴趣的性状的关联关系。

生存分析

单因素COX回归分析用来评估RBPs的预后价值,并筛选出与生存时间相关的RBPs作为基因特征对TCGA和CGGA数据集进行风险分类。然后,通过多元Cox比例风险回归分析构建了风险特征,计算了每个患者的风险评分,最后根据中值将患者分成高低风险组。

有钱真好系列

该研究从ATCC购买了人类GBM细胞系LN229和U251,然后培养、切片、转染等。此外,作者还做了siRNA转染、细胞增殖、qPCR和Western Blot分析,以及RNA免疫沉淀和高通量测序。

统计分析

作者评估了大约3564个RBPs的表达水平。归一化后,用和作为单个患者中RBPs和TFs的表达丰度。DEGs使用R包DEseq2筛选的,绘制箱式图和对表达差异的统计分析用了R包ggplot2、ggpubr和ggsignif。单变量和多变量Cox比例风险回归分析用的都是survival包。生存曲线采用的是Kaplan-Meier法。

结果部分

RBPs在胶质瘤中的表达明显高于TFs
RNA结合蛋白(RBPs)在转录后水平调节基因表达,转录因子(TFs)则在转录水平进行调控。作者对比了二者在几个数据集的丰度,发现RBPs显著高于TFs(图1.C-D)。在3564个RBPs中,差异表达的约43.13%,在1725个TFs中,差异表达的有34.02%,这些数据表明RBPs可能在胶质瘤中起着更重要的作用。

1. RBP在胶质瘤中的表达明显高于转录因子

RPBs表达与临床特征

文中根据WHO的分类标准,将TCGA的胶质瘤患者分成了14类,CGGA患者分成了12类(图2.A-B),然后通过分析RBPs的mRNA表达水平,发现RBPs的丰度随疾病程度的加深而增加。作者又基于患者的RNA测序数据分析了RBPs的表达水平,结果表明具有IDH(这个基因在胶质瘤中突变频率很高)突变的患者,其RBPs表达水平低于野生型。接下来,他们比较了TCGA和CGGA数据集中不同分子亚型的RBPs表达水平,与图2.C中其他三种亚型相比,RBPs在neural亚型中的表达显著下调,并且与疾病等级无关。

2. RBPs表达与胶质瘤临床特征的关系

RBPs的功能富集分析

3.A和B分别列出了部分候选的标准和非标准RBDs(RNA结合结构域),在3564个胶质瘤相关的RBPs中,只有965个包含标准RBDsGO富集结果显示,标准RBPs富集到了转录、翻译、RNA剪接和加工以及线粒体翻译相关的生物过程;而非标准RBPs的富集除了跟标准RBPs有部分重叠外,还在蛋白质修饰、稳定、定位和代谢等生物学过程有富集,KEGG的富集结果与之基本一致。

3. 基于RNA结合域的功能富集分析

RBPs共表达网络模块

作者使用R包WGCNA 将TCGA中包含3564个RBPs的表达数据转换成了基因共表达网络。首先,从TCGA胶质母细胞瘤数据集中选择了160例不同年龄、性别和总生存率的患者进行RBPs表达聚类(图4.A);然后,参数β=6,通过一步邻居网络构建方法获得了10个共表达模块(图4.B);接下来,对不同的共表达模块跟样本性状做了相关性分析,如图4.C所示,黑色模块与年龄显著相关,绿色模块则跟患者的总生存期关联最密切,因此,研究进一步分析了绿色模块和胶质瘤患者预后的关系。

4. WGCNAs识别的共表达网络模块

绿色模块中RBPs的生存分析

作者通过Cox回归分析,在绿色模块中识别了8个预后相关的RBPs(图5.A),它们的风险比(HR)都大于1。然后,文章使用多元Cox比例风险回归模型将这8个RBPs构成了一个基因特征,根据中值风险评分,TCGA和CGGA中的患者都被均分到了高、低两个风险组。生存分析的结果也表明,风险得分高的患者生存时间短(图5.D)。这个基因特征的ROC曲线也展现了它们较好的预测生存期的性能。最后,作者还发现这些 RBPs的mRNA表达水平在高风险组有所增加(图5.F,G),由此认为它们的高表达会影响GBM预后。

5. 不同数据集的生存分析

非标准RBPs参与维持细胞生长

在上文提到的8个预后相关RBPs中,有3个是非标准的,5个标准的。作者设计siRNAs降低了它们在胶质瘤细胞中的表达,来查看它们的生物学功能。在细胞系LN229中,敲除PTRFFNDC3B这两个非标准RBPs,会显著抑制细胞增殖, LRRFIP1,ZC3H12A和HSP90B1这三个RBPs的沉默同样会抑制增殖(图6.B)。此外,作者注意到PTRF参与了GBM增殖的维持,在另一个胶质瘤细胞系U251中敲除PTRF后,细胞增殖也受到了抑制,敲除FNDC3B得到了同样的结果。

6. MTS法测定的LN229细胞增殖

PTRF靶标的RIP分析

基于以上的分析结果,作者在LN229细胞中对PTRF这一非标准RBP做了RIP实验,RIP就是RNA结合蛋白免疫沉淀,是研究细胞内RNA与蛋白结合情况的技术。然后通过高通量测序,识别了PTRF特异性靶基因,并获得了胶质瘤生物学相关的靶RNAs,大多数靶RNAs参与了胶质瘤的增殖(图7B)。对PTRF靶基因的GO富集发现它们显著富集到了转录、蛋白质泛素化和凋亡等过程,以及细胞衰老和细胞代谢等通路(图7C,D)。

7. RIP-seq分析

转自生信人

分享