早期肺腺癌一种新的复发相关免疫特征的临床意义和炎症特点

Clinical significance and inflammatory landscapes of a novel recurrenceassociated immune signature in early-stage lung adenocarcinoma6.508

Cancer Lett . 2020 Jun 1;479:31-41. doi: 10.1016/j.canlet.2020.03.016. Epub 2020 Mar 19.


Abstract

The prevalence of early-stage lung adenocarcinoma (LUAD) has increased alongside increased implementation of lung cancer screenings. Robust discrimination criteria are urgently needed to identify those patients who might benefit from additional systemic therapy. Here, to develop a reliable, individualized immune gene-set-based signature to predict recurrence in early-stage LUAD, a novel recurrence-associated immune signature was identified using a least absolute shrinkage and selection operator model, and a stepwise Cox proportional hazards regression model with a training set comprised of 338 early-stage LUAD samples form TCGA, which was subsequently validated in 226 cases from GSE31210 and an independent set of 68 frozen tumor samples with qRT-PCR data. This new classification system remained strongly predictive of prognoses across clinical subgroups and mutation status. Further analysis revealed that samples from high-risk cases were characterized by active interferon signal transduction, distinctive immune cell proportions and immune checkpoint profiles. Moreover, the signature was identified as an independent prognostic factor. In conclusion, the signature is highly predictive of recurrence in patients with early-stage LUAD, which may serve as a powerful prognostic tool to further optimize immunotherapies for cancer.

Keywords: EGFR mutation; Early-stage lung adenocarcinoma; Immune checkpoints; Immune signature; Recurrence.

一、摘要

本文的工作是使用LASSO算法识别到能预测早期LUAD复发的基于免疫基因集的特征基因,首先在TCGA338个早期LUAD训练集中进行逐步的Cox比例风险回归模型来识别基因,然后在226GEO 68个独立的早期LUAD样本中验证。这个分类系统对不同临床和突变亚群的预后有很强的预测作用。该特征对早期LUAD患者的复发具有高度预测作用,可作为进一步优化癌症免疫治疗的有力预后工具。
二、数据及方法
1. 样本及数据
1TCGA338例早期(肿瘤I期、II期)LUAD样本的RNA-seq数据
(2)GEO226 LUAD样本(GSE31210)的mRNA表达数据和临床数据
(3)从20141月到8月的郑州大学第一附属医院的68例早期LUAD病理诊断样本。使用TRIzol试剂从冷冻样本中提取RNA,然后使用Prime ScriptRT试剂盒将总RNA样品反转录为单链cDNA,用于qRT-PCR。qRT-PCR用于检测样本中9IBRS基因的表达。表1展示样本的临床信息。
(4)免疫相关基因集:从AmiGO 2 Web portalhttp://amigo.geneontology.org/amigo/landing)下载。

1.68例早期LUAD样本的临床特征
2. 特征识别和统计分析
使用单变量Cox比例回归模型识别与无复发生存期(RFS)相关的免疫基因表达。然后使用最小绝对值收敛和选择算子(LASSO)方法在Cox回归模型中确定重要的预后基因,确定一个标准误差(SE)。为了使模型更加优化和实用,使用了逐步Cox比例风险回归模型。
基于预后免疫相关基因的表达对样本构建风险评分Risk score = (exp Gene1 * coef Gene1) + (exp Gene2 * coef Gene2) + +(exp Gene9 * coef Gene9)。将早期LUAD患者按照给定的风险评分分为高风险组和低风险组。使用Kaplan-Meier two-tailed log-rank检验评估高低风险组RFS和总生存期(OS)的差异。所有统计学方法均以P < 0.05为有意义。
3. 预后 meta分析
使用STATA软件对三套样本进行预后meta分析,采用随机效应模型计算了pooled HR
三、 结果解读
1. 基于TCGA样本构建早期LUAD 基于免疫基因集的复发特征(IBRS
TCGA样本中,单变量Cox比例回归模型发现232个免疫相关基因与RFS相关(P < 0.05)。232个免疫相关基因的详细表达模式如图1A所示。对这些基因的GOKEGG富集分析这表明这些基因主要参与先天免疫反应和炎症信号通路(图1BC)。使用LASSO Cox回归模型计算最有用的预后基因,并选择一个高于最低标准的SE,得到一个有11个基因的模型:TGFBR1DYNC1I2LGR4THOC1ADAM10SERPINB6CCL20WNT2BSLC11A1MAPTPSEN1(图1DE)。

1.早期LUAD样本识别预后免疫相关基因
为了优化该模型,使其只包含最具预测性的基因,接下来使用逐步Cox比例风险回归模型,最终确定了9个基因。对每个病人计算风险评分,将TCGA样本根据优化后的风险值分为高风险组和低风险组(图2A),生存分析显示,高风险组的复发率明显高于低风险组(图2B)。然后通过计算ROC曲线下面积来评估预测性能,结果显示,对于预测1年、3年和5年的TCGA复发,IBRS曲线下面积(AUC)分别为0.7750.7890.789(图2C)。当只看I期患者时,IBRS能够将患者分为RFS差异显著的亚组(图2D),II期患者中高的免疫相关风险评分与较差的RFS相关(图2E)。

2.TCGA训练集中构建用于判断LUAD早期复发的免疫相关基因特征
2. GEO数据集验证IBRS
根据上述方法确定的风险评分,将GEO的样本分为高风险组(N = 61)和低风险组(N = 61)(图3A)。生存分析显示,低风险组患者的RFS明显好于高风险组(图3B)。I期患者中,IBRS可明显区分高、低风险组不同的RFS(图3C),然而,IBRS仅在II期患者中显示出RFS的边缘性差异,可能是由于样本量有限(图3D)。此外,高风险组患者的OS明显短于低风险组(图3E)。

3.GSE31210中验证免疫相关特征基因的预后效能
3. 在不同临床亚组的验证IBRS
TCGA早期LUAD样本根据三个临床特征(性别、吸烟和年龄)进行分组。结果显示,在所有亚组中,高风险组患者RFSOS比低风险组患者的更短GSE31210 数据集中也是这种情况。然后分析免疫基因风险评分在D.N. Hayes, et al.发布的三种肺腺癌表达亚型magnoid, squamoidbronchioid中的分布,发现bronchioid亚型表现出明显的高风险评分。将这三种亚型的患者分别分为高风险组和低风险组,在所有分子亚型中,高风险患者的RFS明显低于低风险患者。
4. 不同EGFRKRAS突变状态患者中验证IBRS
EGFRKRAS是肺腺癌常见的突变基因,与不同的肿瘤免疫微环境相关。首先分析TCGA训练集中高、低风险组的EGFR KRAS突变状态。结果显示,与EGFR野生型相比,EGFR突变型低风险患者比例较高。相反,与KRAS野生型组相比,KRAS突变型组具有更高的高风险患者比例。在不同突变状态下,高风险组RFSOS明显缩短。GSE31210样本也得到相同结果。
5. IBRS的炎症概况和免疫检查点景观
接下来是探究不同的免疫相关特征基因与不同的复发风险之间的内在联系。首先,分析了7metagenes(代表不同的炎症和免疫反应,有HCKIgGInterferonLCKMHC-IMHC-IISTAT1这七组)与IBRS之间的关系。图4A展示TCGA数据集中metagene表达情况。然后使用基因集变异分析(GSVA)(一种非参数的无监督分析方法,主要用来评估芯片和转录组的基因集富集结果)来解释这些关系。接下来使用Pearson相关计算样本的风险评分与7metagenes的相关性,图4B展示TCGA数据集中相关性r值分布。分析显示,风险评分与IgGInterferonSTAT1呈正相关,与LCK、和MHC-II呈负相关。在GSE31210数据集中也做了相同分析(图4CD),风险评分与InterferonSTAT1MHC-IILCK相关,表明IBRS与干扰素和干扰素相关的信号转导密切相关。两套样本的风险评分与IgG之间缺乏相关性,可能是由于肿瘤样本的瘤内免疫异质性。

4.早期LUAD风险评分与炎症反应的关系
由于风险评分与炎症活性密切相关,接下来分析了特异性免疫表型的差异水平,包括免疫细胞浸润和免疫检查点。5AB分别展示使用CIBERSORT评估TCGAGSE31210样本的高低风险组的免疫细胞表达情况。在两组患者中,高风险组中活化的CD4记忆T细胞和M1型巨噬细胞的比例显著升高,静息肥大细胞的比例显著降低。图5CD展示在TCGAGSE31210样本中对30个免疫检查点分子表达情况,发现了4个免疫检查点B7-H34-1BBOX40LIDO1,在两组患者的高风险组中均表达上调。

5.早期LUAD的风险评分与免疫功能的关系
6. 冷冻组织样本验证IBRS
68例早期肺腺癌患者冷冻组织样本使用相同的公式,计算每个患者的风险评分,将患者分为高风险组和低风险组(N = 3434)(图6A)。高风险组和低风险组之间的RFS存在显著差异(图6B)。此外,I期或II期患者的风险评分对RFS的预测有显著性差异(图6CD)。高风险组患者的OS明显低于低风险组(图6E)。为了调查这三套患者样本(n = 632的综合预后价值,使用STATA软件进行了预后meta分析。结果显示IBRS是早期LUAD患者肿瘤复发的重要风险因素。

6.独立68个冷冻组织样本中验证免疫相关特征基因的预后效果
7. IBRS是早期LUAD患者的独立风险因素
TCGA训练样本中进行了单变量和多变量Cox回归分析。结果表明,经年龄、性别、吸烟史、T分期、淋巴转移、TNM分期、EGFRKRAS突变情况调整后,IBRSRFSOS的重要独立预测因子(表2)。GSE31210的结果也一致证实IBRSRFSOS 的预测价值独立于其他因素。在68个独立样本中,同样的也证实IBRSRFSOS 的预测价值。

2. TCGA样本的IBRS与其他特征的单变量和多变量Cox回归分析

总结:

本文的工作是将TCGA 的早期LUAD复发样本作为训练集,基于LASSO算法和逐步的Cox比例风险回归模型来识别到一组基于免疫基因集的复发特征基因,然后对样本构建风险评分,划分高、低风险组,分析发现风险评分与FPSOS显著相关,并在GEOLUAD样本中验证。接下来在不同临床亚组、肺腺癌亚型和不同EGFR KRAS突变状态分组下高、低风险组与RFSOS的相关性。然后分析高、低风险组与不同的炎症和免疫反应的关系。最后在68例早期肺腺癌样本中进行验证高、低风险组与FPSOS相关性。通过单变量和多变量Cox回归分析证明IBRS是早期LUAD患者的独立风险因素。

转自生信人

分享