Circulating tumor DNA methylation profiles enable early diagnosis, prognosis prediction, and screening for colorectal cancer循环肿瘤DNA甲基化谱可实现结肠癌的早期诊断,预后预测和筛查17.161
Sci Transl Med . 2020 Jan 1;12(524):eaax7533. doi: 10.1126/scitranslmed.aax7533.
Abstract
Circulating tumor DNA (ctDNA) has emerged as a useful diagnostic and prognostic biomarker in many cancers. Here, we conducted a study to investigate the potential use of ctDNA methylation markers for the diagnosis and prognostication of colorectal cancer (CRC) and used a prospective cohort to validate their effectiveness in screening patients at high risk of CRC. We first identified CRC-specific methylation signatures by comparing CRC tissues to normal blood leukocytes. Then, we applied a machine learning algorithm to develop a predictive diagnostic and a prognostic model using cell-free DNA (cfDNA) samples from a cohort of 801 patients with CRC and 1021 normal controls. The obtained diagnostic prediction model discriminated patients with CRC from normal controls with high accuracy (area under curve = 0.96). The prognostic prediction model also effectively predicted the prognosis and survival of patients with CRC (P < 0.001). In addition, we generated a ctDNA-based molecular classification of CRC using an unsupervised clustering method and obtained two subgroups of patients with CRC with significantly different overall survival (P = 0.011 in validation cohort). Last, we found that a single ctDNA methylation marker, cg10673833, could yield high sensitivity (89.7%) and specificity (86.8%) for detection of CRC and precancerous lesions in a high-risk population of 1493 participants in a prospective cohort study. Together, our findings showed the value of ctDNA methylation markers in the diagnosis, surveillance, and prognosis of CRC.
循环肿瘤DNA(ctDNA)指坏死或凋亡的肿瘤细胞释放到外周血中的肿瘤DNA 片段,其带有肿瘤特异性突变或表观遗传学改变,是肿瘤患者游离DNA(cfDNA)中的一部分。这篇文章研究了ctDNA甲基化标记物在结直肠癌(CRC)诊断和预后中的潜在用途,并使用前瞻性研究来验证其在筛查高风险的CRC患者中的有效性。研究发现了单个ctDNA甲基化标记物cg10673833在检测1493名高危人群中的CRC和癌前病变方面具有高的灵敏度(89.7%)和特异性(86.8%)。为CRC的早期诊断甚至提高CRC患者的生存率方面做出了卓越贡献。
1.数据和基本流程
首先文章收集了TCGA(COAD和READ) 中的459个CRC肿瘤样本和GSE40279中的754个正常样本的甲基化谱图,使用基于经验贝叶斯t检验选择前1000个显著标记物(p<0.05)并通过分子实验选择了544个CRC特异性的甲基化标记物;然后,文章通过机器学习算法,使用来自广州中山大学肿瘤防治中心,西安西京医院和成都华西医院的801名CRC患者和1021名正常样本的cell free DNA(cfDNA),开发了预测性诊断和预后模型。(图1A)
最后文章进行了一项前瞻性研究,由2015年1月至2017年12月参与的16890名受试者组成,年龄在45至75岁之间,没有CRC相关症状。根据修改后的Harvard 风险指数计算的相对个人风险指数>1.5被认为是CRC高风险人群,共有1493名参与者接受了结肠镜检查和cfDNA甲基化测试(图1B)。其中29名在结肠镜检查中发现CRC(1.9%),78名患有晚期癌前病变(5.2%)。
图1.流程图
2.基于cfDNA的CRC诊断预测模型
文章使用LASSO和随机森林算法分析了544个甲基化标记物的数据集,以减少标记物的数量。将样本以2:1的比例随机分配到训练集和验证集中(图2A)。我们从这两种算法中获得了九个重叠的标记物,并用逻辑回归模型构建了一个诊断分数(cd-score)。使用该评分,观察到在训练集和验证集中预测结果与病理诊断结果之间的高度一致性(图2,B至E)。与癌胚抗原(CEA)相比较,cd评分显示出优良的敏感性和特异性(图2F)。此外,通过使用约登指数发现cd-score可以很好地区分CRC和正常样本(图2,G和H)。
图2. 基于cfDNA的CRC诊断预测模型
3.基于cfDNA的CRC预后预测模型
在cfDNA甲基化分析的基础上,用UniCox和LASSO-Cox方法减少维度并构建了5个变量的Cox模型(cp-score)进行预后分析(图3A)。Kaplan-Meier曲线是使用二分法综合得分将患者相对于中位数分为高低风险组。低风险组的中位生存时间明显好于高风险组(训练集的P <0.001,验证集的P = 0.0012)(图3,B和C)。文章使用时间依赖性ROC来表征TNM(tumor, node, metastasis)分期(由AJCC定义),CEA浓度,原发肿瘤位置以及所有现有生物标记物组合的预测潜力。结果表明,cp-score和临床特征的组合提高了预测预后的能力(图3,D和E)。
图3. 基于cfDNA的CRC预后预测模型
4.基于cfDNA的CRC亚型
为了生成基于cfDNA甲基化的CRC亚型,文章使用了改进的无监督聚类方法。该方法应用了一种迭代策略,该策略可以从共识聚类生成的共识相似性矩阵中得出最佳特征和聚类(图4A)。使用与上述预后模型相同的训练数据集,文章获得了两个在45个甲基化标记物中显著差异的CRC亚型(图4,B和C)。并在验证集中观察到两个亚型之间的45个标记物的甲基化谱有明显不同(图4D)。文中还分析了两个亚型之间多种因素的差异,包括TNM分期,肿瘤部位,错配修复状态,微卫星稳定状态,肿瘤负荷,性别以及生存结果。发现亚型1与亚型2相比更多地在早期阶段(I和II)被诊断出来(图4E, P <0.05,卡方检验)。亚型2的生存率显著低于亚型1(图4E, P<0.01,对数秩检验)。
图4. 基于cfDNA的CRC亚型
5.甲基化标记物cg10673833用于高危人群CRC的筛查和早期诊断
文章分析过程中发现CpG位点cg10673833的甲基化状态在CRC诊断中展现了巨大效率。因此,研究了cg10673833作为甲基化标记物在高危人群中检测出CRC和癌前病变潜力。表1显示了结肠镜检查结果和cg10673833甲基化检测结果。结果表明cg10673833甲基化能够很好地进行CRC患者的筛查(灵敏度89.7%和特异性86.8%),特别是早期和原位癌。
表1. 甲基化标记物cg10673833用于高危人群CRC的筛查和早期诊断
总的来说,文章评估了cfDNA甲基化标记物对CRC监测的潜在作用以及在CRC筛查中的功效。对CRC患者的筛查和早期诊断治疗以及提高预后生存率等都有重要意义。
转自生信人