急性粒细胞白血病预后预测代谢风险模型的系统构建与验证

Systematic Construction and Validation of a Metabolic Risk Model for Prognostic Prediction in Acute Myelogenous Leukemia

急性粒细胞白血病预后预测代谢风险模型的系统构建与验证

文章主要讲的是利用多数据集、多平台TCGA+GEO+TAGRGET、不同年龄(儿童+成人对白血病进行预后模型构建和验证,很成熟的一个分析套路。

文章背景
急性髓细胞白血病是成年人急性白血病的类型之一,在不同的患者中存在较强的基因变异异质性。由于其异质性和难治性,对白血病患者进行危险分层是保证患者进行准确治疗的重要前提。欧洲白血病机构(ELN)在2017年的指南中有提到根据关键基因对患者进行有效分层和后续治疗指导,但是在既往文献中细细分析按照这个分层指导进行的患者数据,就会发现在同一分层中的患者预后也会层次不齐,因此需要一个更好的结合其他遗传或细胞变异因素的预后工具来对急性髓性白血病患者更好的分层。
本文作者结合白血病在代谢方面的异常提示,从代谢风险因素出发,利用数据库数据进行分析挖掘,搭建了一个急性髓细胞白血病预后预测代谢风险模型,并进行验证。一起跟小编来看看作者是怎么一波操作吧。
分析思路和方法
1、 数据: 3个AML数据集共879例患者,分别是GSE37642(GEO数据库)、TCGA-LAML和TARGET-AML(UCSC Xena);
2、 分析思路:GSE37642数据作为训练集,采用LASSO方法构建代谢风险模型,TCGA-LAML和TARGET-AML分别作为成人和儿童的验证集数据。根据训练集中确定的统一公式,为每个患者生成代谢风险评分。利用survminer软件包确定代谢风险评分的最佳cut-off值,将患者进一步分为高风险组和低风险组,分析高低风险组患者在病理上的特征分布,采用GSEA对高风险组和低风险组的患者进行差异通路分析,挖掘可能的差异性代谢通路,并与既往预后因素进行比较分析。

1 模型构建及验证的数据筛选

结果解读
1、 代谢风险模型构建
基于使用来自c2.cp.kegg.v7.0.symbols的代谢路径相关基因集,采用LASSO Cox分析方法进行预后模型构建,经过1000次迭代,最终选择9个代谢相关基因构建模型,模型公式如下:metabolic risk score=0.018×ALDH2 expression-0.103×CYP2E1expression+ 0.078 ×DNMT3B expression+0.032×ENPP2 expression-0.010×HAAO expression-0.039×ITPKA expression-0.007×PAFAH1B2 expression+0.040×PHGDHexpression+0.015×PSAT1 expression.


2急性粒细胞白血病预后预测代谢风险模型的建立
2、 代谢风险模型验证及风险评分
采用ROC分析评估代谢风险模型的敏感性和特异性。在训练集中,1年、3年和5年OS的AUC分别为0.73、0.78和0.78。在成人、儿童验证集中,1年、3年和5年OS的AUC分别为0.68、0.71和0.76,0.64、0.64和0.66。根据风险评分的高低对患者进行划分,发现代谢风险评分较低的患者通常比高风险评分的患者有更好的生存结果。然后将患者分为高代谢风险组和低代谢风险组,并在每个队列中确定最佳切点。从K-M生存结果看,代谢风险低的患者比代谢风险高的患者的OS生存期要长得多。训练队列中高风险组和低风险组的5年生存率分别为14.5%和55.2%,成人验证集中高风险组和低风险组分别为8.7%和47.4%,儿童验证集中高风险组和低风险组分别为70.7%和37.7%。

3 ROC分析及K-M生存分析
     3、 单因素和多因素分析
除了代谢风险因素外,作者也比较了其他的风险因素,如年龄、RUNX1-RUX1T1融合和RUNX1突变等其他因素,对这些因素分别进行单因素和多因素分析,并进行Hazard ratio分析。分析发现,在基于其他临床因素,在训练集中代谢特征HR2.75的独立预后指标[95%置信区间:2.06–3.66],成人验证集中HR1.89[95%CI:1.09–3.29],儿童验证集中HR为1.96[1.00–3.84]。

4 单因素(左)和多因素(右)分析
4、 不同代谢风险水平的临床病理特征
作者展示了代谢模型包含的9个代谢相关基因在评分高低风险组的表达热图。以及不同代谢风险水平的临床病理特征分布情况,发现代谢风险水平较高的患者在三个数据集中的细胞遗传学风险水平都较高。此外,分析了TARGET数据集34个配对样本疾病诊断和复发时的代谢风险评分差异,在样本复发阶段代谢风险评分更高。

5 在不同代谢风险水平与其他临床特征相关性分析

5、 GSEA分析挖掘差异代谢通路
针对两个验证集的高风险组和低风险组患者样本数据,采用GSEA方法,验证代谢相关途径。作者发现在高代谢风险组中观察到显著富集的途径,其中大多数是代谢相关途径,包括不饱和脂肪酸的生物合成等以及其他的信号通路,如JAK-STAT信号途径、PPAR信号途径、错配修复调节、自噬调节、RNA降解和DNA复制等。作者还对其中的关键蛋白互作进行了网络分析研究。

6 GSEA分析两个验证集中富集通路
6、 代谢风险评分模型预后其他预后因素的比较分析
既往AML的预后变量有年龄、RUNX1-RUX1T1融合RUNX1突变、细胞遗传学等。作者将构建的代谢风险预后模型与这些变量预后效果的敏感度和特异性比较。与其他的变量相比,训练集中代谢风险模型显示5年OS的AUC更具优势(0.78,p<0.001),但是在两个验证集中并没有。于是作者将代谢风险预后模型与经典模型进行整合,合并评分中5年OS的AUC为0.78,这明显大于包括年龄(0.65)和细胞遗传学风险分类(0.69)在内的经典预后指标,表明与传统的预后因素相比,增加代谢特征可以增加预测OS的准确性。

7 代谢风险评分模型预后与其他预后因素的比较

8 综合模型评估

小编总结

这篇文章使用的方法跟一般的预后分析手段没有什么不同,主要新颖的点在于:1、引入代谢因子作为预后因子(有感兴趣的小伙伴可以仔细看看哦);2、一般做白血病不会把成人和小孩杂糅到一起进行分析,因为其预后是不同的。但是作者用成人白血病样本构建了代谢模型能很好的划分预后差异后,在儿童的样本中再看了下结果,发现效果也是很好的,这个是比较有意思的。

转自生信人

分享