基因分型与 DNA 甲基化 array:2025 年度高分研究与应用趋势盘点


1. 疾病分子分型与生物学异质

       ——以分子特征回答“疾病是什么”



在疾病分子分型相关研究中,可以看到一类持续演进、但方向相对稳定的工作:通过遗传或表观遗传特征,对疾病进行更细致、可重复的分型与亚型刻画

这类研究通常基于横截面的分子数据,更关注分类体系本身的完整性、一致性与可复用性,而不是对结局的预测。


代表性文章


Advancing CNS tumor diagnostics with expanded DNA methylation-based classification (Heidelberg classifier v12.8)

Cancer Cell, 2025

https://www.sciencedirect.com/science/article/pii/S1535610825004957

研究对象:中枢神经系统(CNS)肿瘤,涵盖多种组织学类型,是分子分型最复杂、临床诊断挑战最大的肿瘤领域之一。

主要工作内容:在既有Heidelberg CNS肿瘤甲基化分类体系基础上,对参考数据集与分类标签进行系统性扩展与更新,包括新增肿瘤亚型、细化原有类别,分类准确率高达95%,并提升分类器在临床样本中的适用范围。

在既有研究框架中的推进:该研究并未提出全新的分型方法,而是通过更大规模、更系统的数据整合,使甲基化分型体系在覆盖度、一致性和可复用性上进一步成熟。

在这一研究脉络中的代表性:CNS肿瘤是甲基化分型应用最成熟、也最具代表性的疾病场景

◆ 体现“分型体系级更新”的典型工作模式

◆ 对后续研究和临床实践具有直接参考价值



同一分型脉络下的其他研究


CNS肿瘤×模型可解释性

Explainable artificial intelligence of DNA methylation-based brain tumor diagnostics

Nature Communications, 2025

https://www.nature.com/articles/s41467-025-57078-0

该研究同样以CNS肿瘤为对象,在既有DNA甲基化分型模型基础上,引入可解释人工智能方法。其创新点在于不改变分型性能的前提下,对Heidelberg模型决策依据进行解释与可视化,为分型结果在病理讨论和临床沟通中的使用提供方法学补充。

乳腺癌|三阴性乳腺癌(TNBC)

The DNA methylation landscape of primary triple-negative breast cancer divides TNBC into epigenetic subtypes

Nature Communications, 2025

https://www.nature.com/articles/s41467-025-58158-x

该研究聚焦高度异质性的乳腺癌亚型——原发性三阴性乳腺癌(TNBC)。研究基于DNA甲基化图谱对TNBC进行重新分层,识别出具有生物学差异的表观遗传亚型,并将其与潜在分子特征和调控网络关联,为理解TNBC内部异质性提供新的分子视角。

神经发育相关疾病

Discovery of a DNA methylation episignature as a molecular biomarker for fetal alcohol syndrome

Genetics in Medicine, 2025

https://pubmed.ncbi.nlm.nih.gov/40977504/

该研究关注胎儿酒精综合征(FAS),通过甲基化芯片识别出稳定的疾病特异性episignature,为临床诊断困难的FAS提供了潜在的生物标志物。在这一研究脉络中的位置在于将表观遗传特征直接用于疾病识别与辅助诊断,展示了甲基化分型方法在非肿瘤疾病中的可迁移性。


2. 疾病进展、衰老与时间维度

     ——以表观遗传信号理解“如何变化”

与分型研究并行的,是一批开始引入时间维度的工作。
这些研究不再只关注某一时间点的状态,而是尝试利用分子特征观察疾病进展、演化或衰老过程中的变化轨迹。


代表性文章

Fluctuating DNA methylation tracks cancer evolution at clinical scale

Nature, 2025

https://www.nature.com/articles/s41586-025-09374-4

研究对象:多种肿瘤类型(以血液系统肿瘤为主)的疾病进展过程。

主要工作内容:基于DNA甲基化芯片构建用于推断疾病演化历史和进展节律的定量框架,将甲基化信号视为记录长期生物学变化的“时间标记”。

在既有研究框架中的推进:将甲基化芯片从“静态分型工具”拓展为动态过程分析的输入数据

为何作为代表性:代表甲基化芯片在“时间维度”应用上的方法学延展,对理解疾病进展具有示范意义。


同一分型脉络下的其他研究

代谢性疾病与结局关联

DNA-methylation age acceleration and mortality risk in diabetes and pre-diabetes

Clinical Epigenetics, 2025

https://clinicalepigeneticsjournal.biomedcentral.com/articles/10.1186/s13148-025-01886-0

该研究在糖尿病及前驱糖尿病人群中,分析DNA甲基化衰老加速与死亡风险之间的关联,证实了DNA甲基化衰老加速可作为糖尿病和前驱糖尿病患者死亡风险的有效生物标志物,为个体化健康管理和风险分层提供了潜在工具,更体现了表观遗传指标在长期结局研究中的应用价值。

方法学基础文献(背景参考)

Epigenetic prediction of complex traits and death

Genome Biology, 2018

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-018-1514-1

该研究系统评估DNA甲基化特征对多种复杂性状及死亡风险的预测能力,为后续将表观遗传信号用于疾病进展与结局分析奠定方法学基础。


3. 人群尺度的风险分层与队列研究

     ——基因分型芯片在公共卫生研究中的长期角色

当研究视角从单一疾病或小规模队列,转向国家级、长期随访的人群研究时,技术选择本身开始具有方法学和公共卫生层面的意义。在这一背景下,基因分型芯片不再只是“获取遗传信息的工具”,而逐渐成为公共卫生研究中可持续运行的基础检测体系。


代表性文章

Realising the full potential of Our Future Health through data linkage and trans-biobank efforts

Nature Genetics, 2025

https://www.nature.com/articles/s41588-025-02327-7

研究对象与应用场景:Our Future Health(OFH)是英国推进中的国家级人群队列项目,目标是在真实公共卫生体系中,长期收集大规模人群的遗传、健康和随访数据,用于疾病风险研究、早筛策略评估以及公共卫生决策支持。

主要工作内容:这篇文章并未聚焦某一具体疾病,而是从方法学和基础设施层面,系统讨论了OFH项目如何通过数据链接(如医疗记录、登记系统)与跨生物样本库协作,最大化人群遗传数据的研究价值。

文中明确强调:

队列的长期价值不仅来自样本量

更取决于数据的一致性、可比性以及可持续更新能力

在既有研究框架中的推进:相较于以往以科研为主导的队列研究,OFH更接近公共卫生基础设施的定位。在这一框架中,基因分型芯片的作用并非追求“最前沿测序深度”,而是提供一种:

在百万级样本中可规模化部署

在多年随访中保持稳定

在跨中心、跨批次条件下具备可比性的遗传检测方式

这种定位,使芯片成为连接遗传风险研究与公共卫生实践的关键底层工具。

在这一研究脉络中的代表性:在当前关于人群队列和公共卫生遗传研究的讨论中,OFH 所体现的并不是单一技术的“性能优势”,而是技术选择与研究目标之间的匹配关系。

这项工作集中体现了一种研究范式:当目标是长期、可扩展、可治理的人群健康研究时,基因分型芯片提供的是一种在成本、标准化和运行稳定性之间取得平衡的解决方案。

相关研究

Cohort Profile: Our Future Health

International Journal of Epidemiology, 2025

https://academic.oup.com/ije

该文章系统介绍了OFH队列的设计、样本来源与数据结构,为后续研究提供背景参考。目前,该项目已采用多渠道招募策略获得超过240万名参与者的知情同意,覆盖多年龄段、多种族、多社会经济背景的多样化人群,为开展常见与罕见病的病因学、精准预防及转化医学研究提供了前所未有的平台。


4. 预测模型与方法学一致性

    ——基因与测序平台的比较视角

随着研究走向预测和应用阶段,一些工作开始回到方法学本身,讨论不同技术平台对结果一致性的影响。


代表性文章

Genomic platform-specific polygenic risk scores impact breast cancer risk stratification

Communications Medicine, 2025

https://doi.org/10.1038/s43856-025-01298-4

研究对象:乳腺癌风险预测(PRS)。

主要工作内容:系统比较不同基因分型平台(芯片与测序)对PRS风险分层结果的影响。结果显示,不同测序/芯片平台的PRS风险估计存在系统性差异,即使经过平均校正,高风险分类的一致性在不同平台间也有明显波动。因此在PRS临床应用、种族适用性和跨项目一致性评估中必须考虑平台选择的影响。少数样本的风险分层在平台之间可能发生变化,对处于临界风险阈值附近的人群,其风险分层可能随平台而变。

在这一研究脉络中的位置:明确指出平台差异与校准策略会直接影响预测结论。

在这一研究脉络中的代表性:体现方法学一致性在应用阶段的重要性。


相关研究

DNAm age differences between Infinium Methylation EPIC v1 vs EPIC v2 in buffy coat, PBMC, and saliva samples

Communications Biology, 2025

https://www.nature.com/articles/s42003-025-08021-y

该研究比较了不同版本甲基化芯片在衰老指标上的一致性,为历史数据与新平台数据的衔接提供参考,强调了在衰老指标分析过程中考虑特定平台因素的必要性,为未来开发高稳健性、低平台依赖的甲基化时钟提供重要参考。

Comparison of current methods for genome-wide DNA methylation profiling

Epigenetics Chromatin,2025

https://pubmed.ncbi.nlm.nih.gov/40855329/ PubMed

该研究对比了WGBS、Illumina EPIC甲基化芯片、EM-seq及Oxford Nanopore(ONT)第三代测序在多种人类样本中的检测性能,从覆盖度、准确性、成本和实际实施等维度进行评估。尽管不同方法在CpG位点检测上存在显著重叠,但各自也识别出特有位点:ONT在复杂区域具有补充优势,而EPIC甲基化芯片在大规模研究中的一致性、可重复性和操作稳定性方面表现突出,为不同研究目标下的方法选择提供了实践参考。


结 语

将这些研究放在一起回看,可以看到基因分型芯片DNA甲基化芯片在不同研究层级中的使用方式逐渐清晰。它们并不追求覆盖所有问题,而是在分型、进展、人群与方法学等具体场景中,持续发挥稳定、可复用、可校准的测量价值。


希望这篇汇总可以作为一个随时可回看的入口,在你需要查找相关研究时,提供一些清晰的参考线索。

转自测序中国

分享