数据挖掘中最后一步往往是KEGG和GO分析,那么KEGG究竟是什么呢?
KEGG,全称Kyoto Encyclopedia of Genes and Genomes,是一个从分子水平信息,特别是基因组测序和其他高通量实验技术产生的大规模分子数据库,以了解细胞、有机体和生态系统等生物系统的高级功能和效用的数据库资源。自95年推出第一版以来,进行了陆续的丰富和更新。最近一次更新,于10月1日发布了92.0版本。
以获得诺奖的氧感知研究相关的HIF为例,我们来看一下这个数据库。


进入该通路,可以看到关于HIF-1信号通路的介绍:
缺氧诱导因子1 (HIF-1)是一种转录因子,是调节氧稳态的主要因子。它由两个亚基组成:诱导表达的HIF -1α亚基和组成表达的HIF -1β亚基。在常氧条件下,HIF-1在特定的前体残基上发生羟基化,从而导致亚基的立即泛素化和随后的蛋白酶体降解。相反,在缺氧条件下,HIF-1亚基变得稳定,并与p300/CBP等共激活因子相互作用,调节其转录活性。最终,HIF-1在缺氧条件下成为众多缺氧诱导基因的主调控因子。HIF-1的靶基因编码增加氧气O2传递的蛋白,介导对O2剥夺的适应性反应。尽管它的名字是HIF-1,但HIF-1的产生不仅是由于氧可获得性降低,而且还包括由其他刺激物,如一氧化氮或各种生长因子引起的。

之后是通路图,我们点开它,可以看到整个HIF-1信号通路



在另一种KO表现形式中,方框中的因子背景被标记成了紫色。

回来看,通路之后是有关疾病的介绍,可以看到HIF-1与糖尿病视网膜病变、恶性副神经节瘤等疾病的发生发展有关
之后是大量的引文,我们在作者中发现了诺奖获得者之一彼得·拉特克利夫(Sir Peter J. Ratcliffe)



我们可以看到,正常肝脏经历肝炎、肝硬化、增生结节、早期肝硬化和转移的过程中的信号通路。患者在酗酒、吸烟等高危因素下,感染乙肝、丙肝病毒,成为肝炎携带者。之后TGF和IGF-Ⅱ等因子过表达,分别作用于细胞表面的EGFR和IGFR,经过钙离子、PI3K-Akt等信号通路后,引起一系列病理生理反应,造成不典型增生、DNA损伤、细胞坏死等,影响预后。