机器学习方法检测癌症基因组图谱中激活的Ras信号通路
Machine Learning Detects Pan-cancer Ras Pathway Activation in The Cancer Genome Atlas.
背景知识
RAS信号通路是一种很常见的细胞分子信号通路:受体酪氨酸激酶(RTK)结合信号分子,形成二聚体,并发生自磷酸化而活化,活化的RTK激活RAS,由活化的RAS引起蛋白激酶的磷酸化级联反应,Ras通路因癌症类型不同经常发生变化。
RAS基因是一种原癌基因。作为原癌基因的Ras基因被激活以后就变成有致癌活性的癌基因.通常通过获得的KRAS、NRAS或HRAS基因突变或NF1基因丢失,Ras通路被激活,其表达产物Ras蛋白发生构型改变,与GDP的结合能力减弱,所以与GTP结合,又因为Ras蛋白和GTP结合后不需外界生长信号的刺激便自身活化,接着活化状态的Ras蛋白持续地激活PLC产生第二信使,造成细胞不可控制地增殖。
胰腺癌、皮肤黑色素瘤、甲状腺癌、肺腺癌和结肠癌的发生主要由Ras通路基因突变驱动。此外,Ras突变也被认为是导致肿瘤发生的早期事件,与不良的生存率和治疗抗性相关。由于Ras通路在各种肿瘤中广泛失调,研发针对该通路的特定治疗靶点是抗癌药物研发的重点之一,但Ras又很难成为治疗靶点。要改变这点,关键是能精确检测到突变的基因位点。
评估Ras通路激活最直接的方法是通过Ras的靶向测序,但该方法检测不到激活的Ras表型突变体中其它基因的未知突变,而针对这类肿瘤的检测可使更多患者有靶向治疗的机会。本文介绍应用机器学习从泛癌图谱中整合出庞大的RNA测序、拷贝数和突变数据,并将该方法应用于Ras基因检测,证实泛癌中Ras的激活。
用于预测通路行为的机器学习模型
检测RAS信号泛癌激活
RAS信号分类器的基准分析
在细胞系中检测激活Ras信号
其它Ras通路表型突变模拟Ras激活
点评:
本文用机器学习的方法来构建了弹性网络惩罚的分类器,开创了在Ras通路研究上的一个新应用。而更可贵的是,这个分类器经TCGA的其他小组应用,在其他表达通路上也有不错的表现。或许在现阶段这种缺乏部分监督与标准化的方法无法成为主流的研究办法,但在测序分析中,它可以作为辅助办法来查漏补缺,通过模型增加数据的可读性,回避一些传统方法会引起的偏差。使研究结果更多样化,结论更可信,为将机器学习应用在生物信息学及医学上提供良好思路。
参考文献:
Way Gregory P,Sanchez-Vega Francisco,La Konnor et al. Machine Learning Detects Pan-cancer Ras Pathway Activation in The Cancer Genome Atlas.[J] .Cell Rep, 2018, 23: 172-180.e3.