转自联川生物
蛋白质代表疾病的中间表型,并提供对遗传和非遗传风险因素如何与临床结果相关联。蛋白质水平和DNA序列变异与常见疾病的危险等位基因共定位之间的关联可以揭示疾病相关的途径,揭示新的药物靶点和转化医学的生物标记物。Olink蛋白质组学检测技术的发展为使用GWAS检测pQTL(protein quantitative trait loci,蛋白数量性状位点,指影响蛋白水平的位点)进行循环蛋白遗传调控研究铺平了道路,已报道数百个SNP与蛋白质水平存在关联。
与蛋白质水平相关的遗传变异分两类:顺式pQTL(cis-pQTL)为靠近编码蛋白质的基因;反式pQTL(trans-pQTL)距离编码蛋白质的基因更远,通常位于不同染色体上。如果使用孟德尔随机化(MR),基因变异和蛋白表达水平都能与表型结果稳健相关,这可能提供了最好的证据,表明该蛋白与正在研究的疾病有因果关系。这是因为,虽然蛋白质的表达可能会因为疾病而发生改变,但基因变异却不能。
对来自历史药物开发项目的数据的评估显示,具有孟德尔随机化(MR)和共定位支持的蛋白靶点适应症对更有可能获得批准,这证明了这种方法在确定和优先考虑潜在治疗靶点方面的价值。2020年的一篇自然遗传杂志的文章对这种因果关系做了描述(如上图)
Zheng, J., Haberland, V., Baird, D. et al. Phenome-wide Mendelian randomization mapping the influence of the plasma proteome on complex diseases. Nat Genet 52, 1122–1131 (2020).
SCALLOP 联盟(Systematic and Combined AnaLysis of Olink Proteins)是全球最大的pQTL合作研发的框架,是专门使用Olink PEA蛋白质组学技术来发现和跟踪与蛋白质的遗传关联。到目前为止,来自28个研究机构的33个PI参与了这项工作,目前包括65 000多名患者和对照组的汇总水平数据。
以pQTL发现为目的的多组学的临床队列研究的主要功能在于:
1)发现疾病的致病机制
2)发现新的药物靶点
3)发现药物的新治疗适应症
4)识别临床相关的生物标志物
在2020年发表于《自然-代谢》的一项研究中,SCALLOP联盟成员15个GWAS研究队列中的3万多人中确定了90种心血管蛋白(Olink CVD I检测试剂盒)的蛋白定量性状位点pQTL,从而得到了85种蛋白的451个pQTL(与蛋白表达水平相关的遗传变异)。这篇文章也是SCALLOP联盟的第一个研发成果。
该研究基于pQTL的框架是为了解决与药物开发相关的几个关键挑战而开发的,包括
a) 循环蛋白的潜在调控途径的映射,
b) 基于致病蛋白的新靶点候选者的识别:这次研究发现了11个新的蛋白和疾病因果关联,经过临床实验数据库查询,发现了11个潜在的药物靶点。
c) 药物在开发中的重新定位,
d) 靶点相关的安全性
e) 通过蛋白生物标志物和以蛋白靶点为中心的遗传风险评分PRS对疾病早期预测:
图:支持旧靶标验证和重新定位(老药新用)蓝色和靶标介导的安全性的蛋白-性状关系 紫色,以及药物开发的新候选药物靶点发现 绿色。
表:靶标的疗效,安全性和副作用分析
2021年三月份,利用上篇文献提到的既有队列的免疫炎症蛋白质组(OLINK Inflammation panel)检测,SCALLOP联盟成员在医学预印本上发布了最新的多组学研究成果,这次,他们把研究聚焦到了肺癌的多组学研究上。其研究思路和设计可见下图;这项研究的目的是利用基因组学,蛋白质组学和疾病表型组等多组学数据来源来识别导致肺癌风险的病因相关的炎症和免疫相关蛋白。基于在上篇文献中队列30,913个体的蛋白质数据和GWAS数据中鉴定出的pQTL,第一步,使用一个大的GWAS进行了一个探索性的双样本孟德尔随机化(MR)来鉴定候选具备疾病因果的蛋白。在敏感性和共定位分析后,评估使用孟德尔随机化(MR)和评估肺癌患者的肿瘤免疫特征的潜在致病通路。随后,研究人员利用英国生物样本库中的多基因评分预测蛋白浓度,直接拿到诊断前病例对照患者的血液蛋白质检测浓度,和TCGA(the Cancer Genome Atlas)数据库中的相关基因表达情况和临床表型数据进行了结果验证。
研究人员报道了多条证据支持IL-18在肺癌病因学中的保护作用。IL-18可能通过肺组织局部的CD8T和NK细胞计数来抑制肿瘤的发生,这与目前对IL-18功能的理解一致。总之,这些结果突出了IL-18作为肺癌的病因学生物标志物和免疫肿瘤治疗的潜在靶点的潜力。
图:研究设计的概况
2021年5月,SCALLOP联盟的科学家在《动脉硬化、血栓形成和血管生物学》(Arterioscler Thromb Vasc Biol)杂志上发表了一批新的数据。这篇文章采用了SCALLOP联盟中来自7个GWAS研究中的11754个临床样本,利用Olink CVD1 panel的检测数据,颈动脉内中膜厚度(IMT-CCA),斑块的发生和心血管事件(心肌梗死或脑缺血中风)等表型数据确定动脉粥样硬化和心血管事件的因果病理生理机制,并且采用了发现-验证的流程对数据进行了经一步的确认。其实验分析流程见下图。
如下图,荟萃分析发现了一些与颈动脉粥样硬化相关的蛋白质,它们与IMT-CCA、斑块形成和动脉粥样硬化疾病的预后关联部分不同。对mmp-12的孟德尔随机化分析表明,MMP-12水平的增加可能是动脉粥样硬化负担的结果,而不是疾病的致病原因,MMP-12的增加对缺血性中风有保护作用。并且在这个研究中GAL, CD40, CASP-8, 和TRAIL-R2四种蛋白质和动脉粥样硬化的关系在之前并没有文献报道过。
这三项研究均强调了在疾病表型的背景下将基因组学和蛋白质组表达数据联系起来的重要性,以确定药物开发的可操作的蛋白靶点。大多数药物都针对的是蛋白质,而不是基因。所以虽然许多药物是基于基因组发现开发的,但这些药物通常在临床阶段失败,因为它们无法为成功的治疗提供预期的结果。随着Olink蛋白质组学的深入pQTL会应用的越来越广泛。
Reference:
Suhre, K., McCarthy, M.I. & Schwenk, J.M. Genetics meets proteomics: perspectives for large population-based studies. Nat Rev Genet 22, 19–37 (2021). https://doi.org/10.1038/s41576-020-0268-2
https://www.olink.com/scallop/
Folkersen, L., Gustafsson, S., Wang, Q. et al. Genomic and drug target evaluation of 90 cardiovascular proteins in 30,931 individuals. Nat Metab 2, 1135–1148 (2020).
Lars Lind. Arteriosclerosis, Thrombosis, and Vascular Biology. Plasma Protein Profile of Carotid Artery Atherosclerosis and Atherosclerotic Outcomes, Volume: 41, Issue: 5, Pages: 1777-1788, DOI: (10.1161/ATVBAHA.120.315597)