转化医学科研好思路

科学研究,尤其临床医学,需要大量人群的数据才可能获得有参考价值的指导性结论。而大量样本也往往意味着高成本,那么这时,借助着公共数据库海量的数据信息,我们就可以高效低成本的开展很多工作了。

以肿瘤基因组TCGA数据库为例:

268308348448056671.jpg

它的初衷是将人类的全部癌症的基因组变异图谱绘制出来,进行系统分析。截至目前,该数据库中已包含33种常见肿瘤(10种罕见肿瘤),11000多肿瘤样本,多种数据类型(基因组、转录组、表观遗传学数据、临床数据等)。利用这个数据库,可以帮助人们了解癌症的发生、发展机制,提高人们对肿瘤发病的认识,指导肿瘤的临床诊断、治疗和预防。

讲了这么多,还是给大家列举一个经典的数据深度挖掘的例子吧,来看看怎么样用数据库里已有的信息,帮助我们更好的开展自己的临床科研。

573202328390527783.jpg

还是以肿瘤研究的TCGA数据库来说,最近《Cellular Physiology and Biochemistry》(IF=5.104)新发表了一篇肝癌预后的研究论文,就是以TCGA数据库挖掘的靶点信息为研究主线开展的。  

694313378778286468.jpg

肝癌(HCC)的发生发展过程中,磷酸酪氨酸磷酸酶(PTPs)通常被认为是肿瘤抑制因子或原癌基因,并且一定程度上与HCC的预后相关。所以首先,研究者从TCGA数据库入手,从321例已报到数据中挖掘出与HCC预后生存相关的5个PTP基因(PTPN12、PTPRN、PTPN18、PTP4A2、PTPRB)。其中PTPN12、PTPNRN、PTP4A2和PTPRB高表达代表预后良好,PTPN18、高表达与不好的预后相关。

16076053190717789.jpg

利用这些信息,研究者们从自己项目采集的180例临床肝癌及癌旁样本中对这5个PTP基因的表达情况开展qRT-PCR和免疫组织化学的验证。结果发现,有三种PTP基因在肿瘤及癌旁组织中呈现显著性的表达差异:PTPN12和PTPN18在肝癌组织中低表达;PTPRN在肝癌组织中高表达。

177800555317274937.jpg

  基于数据分析手段研究这些PTPs与肝癌整体生存期 (OS)和无病生存期(DFS)的关系,研究认为PTPN12PTPN18PTPRN这三者在临床上可作为独立的预后因素。

302153606778099312.jpg

最后,研究仍回归到数据库挖掘,对PTPs提示不同类型的HCC预后情况进行了分析,数据结果显示:PTPN12高表达与HBV型肝癌好的预后正相关,和非HBV型肝癌预后良好负相关。

564519996031235796.jpg

如此,一篇基于临床样本的数据挖掘研究就完成了。不难看出,基于数据库,挖掘出待深入研究的肿瘤相关位点是第一步,找到靶点并验证分析也贯穿了整个研究。从数据库中挖掘靶点信息,一方面节省了实验挖掘的时间,另一方面也省却了实验挖掘的人工和经济成本,实在是临床医生开展科研的“福音”。


分享