【肿瘤早筛】在肺癌发病前数年对外周血CDCP1升高的前瞻性识别

图片


       近几年,随着蛋白质组学技术的飞速发展,为生物标志物的开发以及鉴定开辟了新的方向,使得肺癌早筛成为了可能。在今天放送的推文中,伦敦帝国理工学院的研究者们,通过借助Olink高灵敏度体液蛋白组,有效的识别早期肺癌生物标志物CDCP1循环血液中CDCP1蛋白水平提供了未来罹患肺癌风险的信息,这比烟草暴露等因素更为重要。该生物标志物有望显著改善诊断流程,通过高效的识别高风险患病个体,从而使罹患肺癌的高风险个体从筛查中获益。

         本项研究工作的优势包括验证了CDCP1在三个独立队列中的相关性,并采用了两种不同的统计方法,能够证明诊断前测量的CDCP1浓度与随后的肺癌风险之间的关联性。对CDCP1前瞻性血液水平与肺癌未来风险之间的联系进行分析。该工作也是第一个使用诊断前数据的广泛研究对来自同一人群的数百例肺癌病例的炎症蛋白和基因表达进行综合分析,对潜在风险关联的潜在机制进行了全面的评估。

概述

       在全球范围内,肺癌是导致癌症死亡的主要原因之一,尽管手术,化疗,靶向及免疫治疗的综合应用显著提高了肺癌的生存率,但是与其他癌症相比,肺癌患者的预后相对较差,5年生存率仅约为15%左右。肺癌患者的生存期主要依赖于准确的早期诊断,由于缺乏有效的肺癌早期筛查方法,大部分肺癌在晚期才被诊断出来的,错过最佳治疗时间。

       目前,肺癌的早筛方法主要是依靠影像学(X线胸片和胸部CT)。但是X线胸片分辨率低,很难发现直径<6mm的病变,且存在死角,临床不建议用于肺癌的筛查。低剂量CT诊断可降低多达20%的肺癌死亡率,但它会导致高水平的假阳性,使得大量潜在良性病例进行不必要且昂贵的治疗。如何从尚未出现症状的人群中准确筛选出极少数肿瘤高危群体,及早发现肿瘤、降低发病风险,寻找行之有效的肺癌早期诊断标志物,仍然是亟需解决问题。

         越来越多的流行病学证据表明,炎症在致癌过程中起着核心作用,这已被广泛认为是癌症的标志之一。慢性炎症是诱发某些癌症的危险因素,而癌症本身可以诱发局部炎症过程,从而促进肿瘤增殖和转移。在血液中,炎症可以通过细胞因子和其他循环蛋白的丰度来衡量。炎症在肺癌发生中起到重要作用,少量循环炎症蛋白在肺癌诊断前显著升高,这表明循环蛋白浓度有望作为早期癌变的标志。在寻找肺癌生物标志物的早期研究中,由于缺乏超高灵敏度以及高效覆盖炎症标志物的方法,阻碍了肺癌生物标志物早筛的进程。

         Olink蛋白质组学技术的出现,很好的弥补了高灵敏与标志物高覆盖兼顾的技术空白。在寻找肺癌标志物研究中,研究者使用Olink炎症相关检测panel(同时实现92个相关指标检测)进行相关扩展分析。在队列设计中,对在基线时健康的参与者,进行了长达16年的随访,以此来研究循环炎症蛋白与未来肺癌风险之间的关系。分析包括600多个前瞻性参与者从两个队列作为一个发现集,和一个另外450个参与者进行验证。采用蛋白质组学和转录组学相结合的方法来探索与所鉴定的蛋白质标记相关的通路和分子机制。     

研究方法

        前瞻性队列样本主要来自意大利(癌症与营养研究中心)以及挪威(女性与癌症研究中心,NOWAC),研究人群包括322例肺癌病例和325个健康对照。验证队列包括450个血样,其中包括225例肺癌病例以及225例健康对照。

        炎症蛋白质浓度测定,使用Olink公司试剂盒(Inflammation I panel) 通过多重邻位延伸法测定柠檬酸盐血浆样本中92种炎症蛋白的水平。病例对照配对样本随机分布在896孔板上。为了评估测量的可重复性,研究者对56名意大利参与者(28例病例和28例对照) 以及16个具有相同成分的对照样本进行了两次重复。

          转录组测定,转录组学数据从血细胞总RNA提取中获得。RNA抽提后,使用基因芯片获取miRNA相关数据。

           统计分析,因为样本来源队列,女性与癌症中心相关的研究只包括女性,使得女性在本次研究人群中占比过高。本次主要分析限制在女性参与者(i)最大限度地增加样本量,同时防止未建模的潜在性别和与中心相关的混杂,以及(ii)确保能够整合仅在女性与癌症中心相关参与者中可用的基因表达数据。然后,研究者试图在男性(来自意大利队列)中重复他们的发现。为了保持数据完整性,研究者还纳入了对整个研究人群(即汇集男性和女性)进行分析的敏感性分析结果。

实验结果

         研究者对olink技术平台结果的重复性进行了验证,对56个参与者以及16个对照样本进行两次重复,两次重复结果测量水平的一致性相关性均在0.95以上,表明olink技术平台结果重现性非常好(图一)。

图片

图一   Olink技术平台数据重复性的相关一致性分析
         

单变量回归模型分析显示12种蛋白的循环水平与罹患肺癌患病风险增加相关(表一),其中包括CDCP1HGFIL6OSMMCP1 IL8,VEGFACD6以及CD5的浓度水平与罹患肺癌风险呈现正相关。而 SCFTWEAK以及IL12B与肺癌风险呈负相关。研究者进一步对数据分析模型进行吸烟因素的影响调整,发现大部分蛋白质与未来肺癌风险之间的关联都减弱,但是血液中CDCP1的水平 (OR =1.58 P = 3.09X10-4) 仍然与罹患肺癌风险有非常明显相关。研究者进一步分析了性别,是否吸烟等因素的影响,发现与对照组相比,在发生肺癌的病例中,CDCP1蛋白的血液水平显著升高,且与诊断时间、吸烟习惯和性别无关。该结果进一步在另外一个独立的队列中进行验证。该队列包括225例肺癌患者和225例健康对照,样本中CDCP1血液水平与罹患肺癌有显著性相关。


图片

表一   单变量回归模型分析显示12种蛋白的循环水平与罹患肺癌患病风险增加相关
       

为了研究CDCP1在特定亚型中的作用,并解释肺癌的组织学异质性,研究者对肺癌中中出现的四种最常见的亚型进行了分析: 腺癌(91)、小细胞癌(32)、鳞状细胞癌(26)和大细胞癌(17),并与所有对照组(201)进行比较。发现CDCP1与腺癌以及小细胞癌的相关性最高。(表二)


图片

表二 单个血液蛋白浓度作为预测因子,与罹患肺癌疾病类型之间的关系
         

ROC模型中,单独使用CDCP1作为肺癌预测因素的平均AUC=0.65。而CDCP1与年吸烟量因素叠加,其AUC 0.75会略高于年吸烟量单独数值0.74。如果将与肺癌相关的其他10个蛋白联合组成protein signature对肺癌进行预测,其AUC>0.8,改善了仅包含CDCP1的模型的解释性能。对于腺癌,CDCP1的解释性能略高(平均AUC= 0.68),与仅考虑年吸烟量的模型相似(平均AUC= 0.69)。同时加入CDCP1和年吸烟量将改善模型的性能(平均AUC=0.73),表明CDCP1为腺癌除吸烟因素以外,提供了额外的风险相关信息。


图片

图二 ROC模型分别对肺癌,腺癌以及非小细胞癌进行分析
         

研究者并对CDPC1的血液水平与转录本水平进行了相关性一致性分析。单变量线性模型将CDCP1水平与转录水平进行回归分析,发现CDPC1水平与LRRN3SEM1的表达存在显著关联。利用生物过程进行分组,确定11个与CDPC1相关重要的途径,其中包括:蛋白定位于细胞核,调节细胞粘附,调节趋化等。CDCP1水平与全解析基因表达数据之间的相关性,表明其有可能在WNT信号通路中发挥重要的作用。(图三)



图片


图片

图三   CDPC1相关的生物通路

结果讨论

为了识别肺癌风险的新标记物,研究者在两个前瞻性队列中评估了循环炎症蛋白与继发肺癌风险的相关性,并在独立队列中进行了验证。通过采用互补的统计方法,一致确定CDCP1与未来肺癌风险直接相关,而与诊断时间和吸烟习惯无关。在单变量模型中,12种蛋白质被发现与肺癌状态相关,包括CDCP1SCFIL6IL8等。


在未来的腺癌病例中,CDCP1表现出更好的解释能力。迄今为止,有关CDPC1和诊断前肺癌的通路的描述并不充分。为了更好地理解连接CDPC1和早期癌变的潜在途径,研究者进一步整合了在相同个体中测量的基因表达数据。检测了与CDPC1相关的两个转录本: LRRN3 (富亮氨酸重复神经元蛋白3)SEM1 (26S蛋白酶体复合体亚基)。富集分析表明,CDCP1可能在与细胞粘附和迁移相关的途径中发挥作用,如WNT/b-catenin途径。


总之,本研究在诊断前就发现了肺癌相关的CDCP1表达失调,与吸烟习惯,诊断时间和性别无关。


分享