膀胱癌中利用计算的方法识别肿瘤浸润B淋巴细胞的lncRNA signature与预后和免疫治疗的联系

Computational recognition of lncRNA signature of tumor-infiltrating B lymphocytes with potential implications in prognosis and immunotherapy of bladder cancer膀胱癌中利用计算的方法识别肿瘤浸润B淋巴细胞的lncRNA signature与预后和免疫治疗的联系9.101

Brief Bioinform . 2020 May 8;bbaa047. doi: 10.1093/bib/bbaa047. Online ahead of print.


Abstract

Long noncoding RNAs (lncRNAs) have been associated with cancer immunity regulation and the tumor microenvironment (TME). However, functions of lncRNAs of tumor-infiltrating B lymphocytes (TIL-Bs) and their clinical significance have not yet been fully elucidated. In the present study, a machine learning-based computational framework is presented for the identification of lncRNA signature of TIL-Bs (named 'TILBlncSig') through integrative analysis of immune, lncRNA and clinical profiles. The TILBlncSig comprising eight lncRNAs (TNRC6C-AS1, WASIR2, GUSBP11, OGFRP1, AC090515.2, PART1, MAFG-DT and LINC01184) was identified from the list of 141 B-cell-specific lncRNAs. The TILBlncSig was capable of distinguishing worse compared with improved survival outcomes across different independent patient datasets and was also independent of other clinical covariates. Functional characterization of TILBlncSig revealed it to be an indicator of infiltration of mononuclear immune cells (i.e. natural killer cells, B-cells and mast cells), and it was associated with hallmarks of cancer, as well as immunosuppressive phenotype. Furthermore, the TILBlncSig revealed predictive value for the survival outcome and immunotherapy response of patients with anti-programmed death-1 (PD-1) therapy and added significant predictive power to current immune checkpoint gene markers. The present study has highlighted the value of the TILBlncSig as an indicator of immune cell infiltration in the TME from a noncoding RNA perspective and strengthened the potential application of lncRNAs as predictive biomarkers of immunotherapy response, which warrants further investigation.

Keywords: immunotherapy; long noncoding RNAs; tumor-infiltrating B lymphocytes.

已经有研究表明lncRNA与肿瘤免疫调节和微环境(TME)相关联。该工作提出了一种基于机器学习的方法,通过整合分析免疫、lncRNA和临床特征来鉴定肿瘤浸润B细胞(TIL-B)的lncRNA signature(简称TILBlncSig)。从141个B细胞特异的lncRNA中发现八个lncRNA(TNRC6C-AS1,WASIR2,GUSBP11,OGFRP1,AC090515.2,PART1,MAFG-DT和LINC01184)可以作为预后signature。且在不同的独立数据集中进行生存分析得到验证。TILBlncSig的功能表明它可以作为单核免疫细胞(即NK细胞,B细胞和肥大细胞)浸润的指标。此外,TILBlncSig对于抗PD-1治疗的患者生存和免疫治疗反应的预测存在一定的临床价值。总而言之。从lncRNA的角度发现TILBlncSig作为TME中免疫细胞浸润的指标的价值,证实lncRNA可作为免疫治疗反应的预测生物标志物。

材料方法
作者首先从GEO下载膀胱癌细胞系(GSE64279,GSE122306)和病人表达数据(GSE31684,GSE5287,GSE38264),从TCGA下载病人临床数据和RNAseq数据。18个免疫细胞类型的数据是来自GSE42058, GSE49910, GSE51540, GSE59237, GSE6863, GSE8059, GSE13906, GSE23371, GSE25320, GSE27291, GSE27838, GSE28490, GSE28698, GSE28726, GSE37750 and GSE39889。首先,对表达值进一步log(x+0.05)转换,利用RMA方法标准化。接下来就是方法核心(图1):(i)使用samr R包的SAM方法的计算B细胞系和其他免疫细胞系之间差异表达。在B细胞系中高表达并在其他免疫细胞系中低表达的那些lncRNA被定义为TIL-B相关的lncRNA(TILBlncRNA);(ii)单因素cox用于评估每个TILBlncRNA与生存时间之间的关联并鉴定预后相关的TILBlncRNA;(iii)应用机器学习方法,以基于多变量Cox回归模型以及通过R MASS包中的“stepAIC”函数进行的正向和反向特征选择。(iv)通过多变量Cox回归系数加权的TILBlncSig,将lncRNA的表达值随后转化为风险评分(TILBlncSig评分),以便于计算样本风险评分。

使用R survival 包中的survdiff函数比较高危和低危人群的生存分布差异。然后通过coxph函数对TILBlncSig的个体临床变量进行单变量和多变量Cox分析。并使用R survivalROC包评估TILBlncSig的预后性能。使用clusterProfiler进行基因集富集分析。使用DAVID进行GO和KEGG功能富集分析。

图1. 工作流程

结果
1. 鉴定预后的B细胞特异性lncRNA
为了鉴定B细胞特异性lncRNA,在B细胞系和其他免疫细胞系之间进行了lncRNA的差异表达分析,鉴定了141个差异的lncRNA。这141个差异的lncRNA被认为是B细胞特异性lncRNA。随后,对202例BCa患者的生存时间与这141个lncRNA表达水平之间进行单变量Cox回归分析,发现24个lncRNA的表达与生存时间显著相关。

2. 鉴定和评估TILBlncSig以预测TCGA RNA-seq数据集中的预后
为从24个B细胞特异性lncRNA中搜索用于预后预测的生物标志物,使用前向和后向特征选择和多变量Cox回归模型。最后发现8个lncRNA(TNRC6C-AS1,WASIR2,PART1,GUSBP11,MAFG-DT,LINC01184,OGFRP1和AC090515.2)可联合作为预后标志(TILBlncSig)。使用多因素Cox回归系数对lncRNA的表达值加权得到风险评分(TILBlncSig评分):TILBlncSig评分=(-0.2438*TNRC6C-AS1) +(-0.3929*WASIR2)+(-0.2645*PART1)+(-0.4645*GUSBP11)+(0.6849*MAFG-DT)+(0.4178*LINC01184)+ (-0.3453*OGFRP)+(-0.3408*AC090515.2)。多变量Cox分析显示,TILBlncSig中的8个lncRNA的预测能力是相互独立的(图2A)。

计算每位患者的TILBlncSig得分,然后使用中位数将202位患者分为高风险组(n = 101)和低风险组(n = 101)。TILBlncSig作为风险阈值两组之间生存时间显著差异(图2B)。在评估3年和5年OS时,TILBlncSig的ROC曲线的AUC分别为0.915和0.894(图2C)。TILBlncSig在预测TCGA数据集中同样有效(图2D),TCGA数据集中,在预测3年和5年OS时,TILBlncSig的ROC曲线的AUC分别为0.717和0.695(图2C)。在单变量Cox比例风险回归分析中,发现TILBlncSig与OS显著相关(图2E)。

图2. 在TCGA和测试数据集中TILBlncSig的生存分析
3. TILBlncSig与TIL-B相关
为了探索TILBlncSig的功能,计算mRNA与八个lncRNA中的每一个之间的表达相关性,并选择了相关性排秩前1%作为与TILBlncSig共表达的mRNA。对mRNA进行GO和KEGG pathway富集分析(图3A和B)。使用单样本GSEA评估高风险组和低风险组患者的19个免疫亚群的免疫浸润水平(图3C)。TILBlncSig的四个lncRNA在B细胞系中的表达水平显著更高(图3D)。这些结果表明,TILBlncSig不仅与患者的预后有关,而且还是可以作为TIL-B的指标。

图3. TILBlncSig的功能分析
4. TILBlncSig在具有微阵列平台的多个独立验证数据集中的验证
为了评估TILBlncSig的鲁棒性,使用microarray数据集进一步验证了TILBlncSig的预测能力。对于GSE31684数据集中的93位患者,发现TILBlncSig能够区分生存风险高和低的患者(图4A)。在单变量分析中,还显示TILBlncSig与OS密切相关(图4B)。

图4. 独立数据验证
5. TILBlncSig与常规临床特征的独立性
为了进一步检查TILBlncSig是否可作为独立的预后因素,在三个BCa患者数据集中进行多变量Cox回归分析,包括TILBlncSig和其他临床因素作为协变量。不同数据集的结果均表明,TILBlncSig是对OS预测的独立预后因素(图5A和B)。在独立的GSE31684数据集中,TILBlncSig仍能预测OS(图5C)。这些结果证明TILBlncSig与OS预测的其他常规临床因素无关。

图5. TILBlncSig的稳定性
6. 仅使用lncRNA的signature和其他转录本+lncRNA的性能比较
使用包含PCG,miRNA和lncRNA表达谱的TCGA数据集,TILBlncSig与Liu等人的研究中提出的PCG-lncRNA microRNA的预后性能比较。TILBlncSig在3年和5年OS时的AUC为0.792和0.771,而PCG-lncRNA-microRNA预测在3年和5年中的相应AUC为0.588和0.594。这些结果证明,TILBlncSig在预测存活率方面比PCG-lncRNA-microRNA标志具有更好的预后能力。

7. TILBlncSig作为免疫疗法反应指标的潜力
进一步研究TILBlncSig与PD-L1表达水平之间的关联(图6A)。发现TILBlncSig与免疫检查点基因显著正相关。进一步比较了TILBlncSig分层的高、低风险组的免疫检查点基因的表达模式,发现高风险患者的免疫检查点基因表达水平明显高于低风险组(图6B)。且TILBlncSig和免疫检查点基因之间的交互作用对患者生存的影响,根据TILBlncSig和免疫检查点基因表达的高低组合将患者分为四组(图6C)。与高TILBlncSig和免疫检查点基因低表达的患者相比,TILBlncSig高和免疫检查点基因高表达的患者显示出更好的生存率(图6C)。在ccRCC免疫疗法数据集中测试了TILBlncSig的预测价值,在接受抗PD-1单药治疗的高风险组和低风险组之间,生存率存在显著差异(图7A)。当PD-1表达与TILBlncSig结合使用进行预测。AUC从0.646增加到0.719(图7B)

图6. TILBlncSig和免疫检查点基因表达对患者生存的影响

图7. TILBlncSig在基于免疫检查点抑制剂的免疫治疗中的意义

转自生信人

分享