Nature重磅精读|安进deCODE大规模血浆蛋白质组学研究揭秘遗传学与疾病关联

三篇重磅

著名科学杂志 Nature《自然》近期发布了三篇文章,展示了Olink Explore平台在推动大规模人群蛋白质组学研究方面的强大能力,这三篇发表于Nature杂志的重量级研究均使用了UKB-PPP产生的数据,其中13家国际生物制药公司通过访问英国生物库生成了新的蛋白质组学数据。

图片

三篇Nature重磅|Olink Explore里程碑研究开启大规模人群蛋白质组学新时代

Nature重磅精读|Olink Explore 助力UK Biobank全球最大血浆蛋白质组研究
Nature重磅精读|阿斯利康团队揭秘UKB血浆蛋白组与罕见变异相关性以加速药物研发
安进制药旗下deCODE Genetics和冰岛大学联合团队发表的题为Large-scale plasma proteomics comparisons through genetics and disease associations最新研究成果,作为三篇Nature重磅之一的开创性文章提供了迄今全球范围内最大规模的基于不同蛋白质组学平台检测数据的对比分析,为科学家们提供了更全面蛋白质组学视角,研究遗传学与疾病表型的关联。

图片

Nature 杂志官网三篇重磅文章截图

精读解析

高通量蛋白质组学平台能够测量血浆种数千种蛋白质,将结果结合基因组和疾病表型信息,可以弥补基因组与疾病间的差距。deCODE团队的研究人员对UKB-PPP项目中5万多人样本,包括46,218 个英国或爱尔兰血统个体(UKB-BI)、953 个南亚血统个体(UKB-SA)和 1,513 个非洲血统个体的血浆样本,通过 Olink Explore 3072 血浆蛋白组学平台进行了2,931种蛋白的关联研究,并将研究结果与 36,000 名冰岛人的SomaScan v4血浆蛋白组(4,719种蛋白)研究结果进行了比较,其中 1,514 人也有Olink 数据。

图片
蛋白质组学分析数据集

两个蛋白质组学平台上检测到的cis-pQTL数量相近(Olink检出2,101个 vs SomaScan检出2,120 个),但基于检测蛋白标志物的cis-pQTLs检出比例对比,Olink检出率72%远高于比SomaScan检出率 43%。研究结果也显示两个平台在蛋白质组与基因组关联结果存在相当大的数量差异,文中对不同技术差异可能会影响蛋白质水平与疾病研究给出了研究示例及系统分析,最后也进一步展示了如何利用英国生物库参与者的多样祖源来检测新的关联并改进基因组定位。

亮点成果
精确度(Precision)对比
变异系(the Coefficient of Variation, CV)通常情况下并不能反映检测的精确度和准确性(Accuracy)。比如,一个平台能提供波动窗口非常小的随机数据,但数据与真实目标脱靶(Off-target),也同样会呈现出低CV,却无准确性而言。文中研究人员采用变异系数比值(CV Ratio)即重复检测样本的变异系数与所有样本的CV值之比,来更准确的评估平台数据精确度‍‍‍‍变异系数比值类似于重复测量样本的与所有样品的标准差(standard deviation, s.d. )之比。变异系数比值范围在0-1之间:如果比值为0,则表示对某一样本的重复测量结果总是完全相同;如果CV比值为1,则表示对同一样本的重复测量结果与测量两个无关样本的结果相当。

图片

CV 和 CV比值

基于CV比值的实验设计,研究人员对UKB数据集中1,474个样本和冰岛数据集中的419个样本的重复测量结果进行了比对分析。‍‍‍无论是基于所有蛋白还是基于两个平台共有蛋白,Olink 的中位 CV 比值均低于 SomaScan:所有蛋白中位CV比值 ,Olink 0.35 vs SomaScan 0.50;两个平台共有蛋白中位CV比值, Olink 0.33 vs SomaScan 0.49。因此,Olink 检测平台总体结果比 SomaScan平台更精确。这与之前报道的SomaScan具有更低的质控样品CV相反,同时,也说明质控样品CV并不能准确反映实验平台的精确度准确性,而需要更合理的样品CV比值来进行对比分析。

图片
单独检测的蛋白质水平(左:重复性对比;右:两个平台的相关性)‍‍
蛋白质与表型间关联
研究人员使用Bonferroni调整法对蛋白质与表型的关联进行了多重检验,并对每个平台的蛋白数进行了调整。随后,研究人员心力衰竭阿尔茨海默症炎症性肠病(包括克罗恩病和溃疡性结肠炎)为例,比较了使用这两种平台测量的蛋白质水平之间的关联。
心力衰竭(冰岛 n = 1,369 例,UKB n = 676 例)两种平台的利钠肽B(BNP)表现出了最显著的相关性,与循环BNP水平与心力衰竭的相关性一致,而某些其他蛋白结果则不一致。对阿尔海默症冰岛 n = 389 例,UKB n = 224 例),神经丝蛋白(NFL)在两个平台都被发现与该疾病密切相关,但方向相反。两个平台NFL的Spearman 相关性很低(r = 0.06)。之前有报道称脑脊液和血液中NFL 含量高与晚期阿尔茨海默症有关,该结果与 Olink 上NFL检测结果一致,且该报道中使用Olink平台的检测结果与另一种基于亲和的检测方法(Simoa)结果具有很强的相关性,而使用SomaScan平台检测的NFL水平与Simoa的检测结果则无相关性。炎症性肠病两个平台上都检出前列腺素-H2 D异构酶(由PTGDS编码)与该疾病最相关,并且在两个平台上都发现了PTGDS的cis-pQTL。虽然两个平台测量的一些蛋白质水平与炎症性肠病显著相关(如 CXCL11 和 REG3A),但一些相关性在两组之间并不重复(如IL-6、MMP12 和 CLPS)。值得注意的是,炎症性肠病 与Olink 测定的CXCL9 水平显著相关,但SomaScan 的两个CXCL9蛋白中,却只有一种显著相关。

pQTL检测比较

研究人员更新了之前在冰岛进行的 pQTL 分析,纳入了更多的序列变异,分别发现了 2,120 个和 22,616 个cis-和tran-pQTL。基于Olink平台的数据中,52%的哨兵trans-pQTL关联与10种以上的蛋白质变异相关,其被称为非特异性pQTL;而基于SomaScan平台的数据中,63%的trans-pQTL与这种变异相关。因此,在Olink所有至少有一个pQTL的2,616个蛋白质中,211个(8%)仅与非特异性trans-pQTL相关;在SomaScan上至少有一个pQTL的4,575个蛋白质中,1,282个(28%)仅与非特异性trans-pQTL相关。‍‍‍‍‍‍‍当一种检测方法没有cis-pQTL 而只有非特异性trans-pQTL 时,其靶向或测量就有可能不准确。
图片
在Olink Explore 3072和Somascan v4平台上检测到的pQTL总结

由于冰岛和UKB两个队列中的样本量足够大,增加样本量也不会使cis-pQTL的数量发生太大变化。2101 个(71%)Olink 检测靶标和 2120 个(43%)SomaScan 检测靶标存在cis-pQTL。虽然,在两个平台上具有cis-pQTL 的蛋白质数量非常相似(Olink 2,093 个 vs SomaScan 2,044 个),但在 Olink 平台上cis-pQTL 蛋白质检出比例高于 SomaScan。当研究人员把进一步分析范围限制在两个平台上的 1,848 个共有蛋白质的匹配数据时,Olink 检测(1,864 个中的 80%)比 SomaScan 检测(1,994 个中的 58%)更能检cis-pQTL。

写在最后

基于大规模血浆蛋白组学UKB(Olink Explore 3072)和冰岛(SomaScan v4)所产生的数据,研究人员得以鉴定出大量pQTL及表型和血浆蛋白质组之间的关联,并对两个不同的蛋白组学平台进行深入分析对比。在这两个样本量相似的数据集中,研究团队观察到了 pQTLs 检测差异。通过直接比较了两个平台数倍于以往研究的蛋白质的测量结果,结果显示两者之间存在较大差异,且研究结论与近期报道一致。文末并展示了这些检测差异会如何影响蛋白质组学与遗传学结合在疾病研究中得出的结论。当前大规模蛋白质组学研究主要是在欧洲血统人群中进行的,最近一些非欧洲血统人群也在检测中。作者的研究结果表明,扩大非欧洲血统人群的样本量将有助于进一步了解这些差异。
参考文献:

1. Eldjarn GH,et al. Large-scale plasma proteomics comparisons through genetics and disease associations. Nature. 2023 Oct;622(7982):348-358.


分享