
模型设计
一、总体思路
采用“发现-复制-验证”三阶段研究设计:首先在发现队列中筛选与临床AD状态相关的血浆蛋白;随后在复制队列中验证候选蛋白的关联性;最后通过外部数据集、生物标志物关联分析、通路富集等深入验证结果,并基于筛选出的关键蛋白构建机器学习预测模型,评估其对AD及其他神经退行性疾病的诊断效能。

实验设置
结果与分析

图2:差异丰度分析
二、外部验证与跨组织对比结果
1)外部数据集验证:353种适配体(78%)在ROSMAP和GNPC联合Meta分析中效应方向一致(P=1.90×10⁻³⁴),333种(74%)经多重检验校正后仍显著,效应量相关系数达0.675(P=1.33×10⁻⁶⁶)。
2)与以往研究对比:416种蛋白中37%(122种)在至少一项以往血浆研究中名义显著,16%(52种)经多重检验校正后显著,61.1%(204种)效应方向与以往研究一致。
3)跨组织对比:445种血浆差异蛋白中174种在脑脊液研究中显著(经多重检验校正),效应量相关系数为0.419(P=2.07×10⁻²⁰),但仅8%的脑脊液相关蛋白在血浆中显著,提示血浆与脑脊液蛋白质组学特征存在差异。

图3:外部数据集的验证
三、生物标志物关联与模型预测结果
1)生物标志物状态关联:血浆差异蛋白与淀粉样蛋白PET成像(效应量相关系数0.764)、脑脊液Aβ/tau状态(0.705)、血浆p-tau217状态(>0.7)均高度相关,前8种核心蛋白在三种生物标志物分析中均显著。
2)预测模型效能:7种蛋白组成的模型对临床AD的AUC在发现测试集为0.796、复制队列为0.72、GNPC队列为0.715、ROSMAP队列为0.757;对生物标志物定义的AD状态AUC更高(淀粉样蛋白阳性0.898、脑脊液Aβ/tau状态0.889、血浆p-tau217状态0.88),与血浆p-tau217(AUC=0.798)预测效能相当。
3)疾病特异性与进展预测:模型对PD(AUC=0.556)和DLB(0.66)预测效能低,对FTD(0.73)预测效能与AD接近;预测阳性者进展为症状性AD的风险是阴性者的2.71倍(HR=2.71,P=1.99×10⁻⁴),且认知正常预测阳性者和AD患者中预测阳性者的CDR-SB评分下降更快。

四、通路与网络分析结果
差异蛋白主要富集于脂质代谢、免疫与止血、细胞外基质、神经元活动、一般代谢五大通路;MEGENA分析识别出274个蛋白共表达模块,其中M4模块(1519种蛋白)富集于少突胶质细胞和细胞内运输、翻译等通路,M7模块(富集于内皮细胞和神经元)富集于细胞外基质组织、轴突导向等通路,强调了细胞外基质和轴突过程在AD中的关键作用。

06 结论