COC分析揭示肝癌亚型的分子特征及分子标记

1.jpg


肝细胞癌作为最复杂的癌症类型之一,自然有茫茫多的亚型。这些亚型之间到底有什么区别,怎么才能简单快速有效的区分?其实,有一种方法,称为 COC(cluster of cluster)分析,就能很好的解决这个问题。


11.jpg


首先,当然是数据的收集。


作者从 TCGA 整理了 256 个肝细胞癌样本,包括 CNV,DNA甲基化,mRNA,miRNA等多种数据集合。然后采用 COC 的方式,对收集的数据进行处理分析。具体的分析方法以后会一一进行解析。反正通过这种分析,作者将肝癌分出了5个亚型。


2.jpg


既然分了亚型,自然免不了对这 5 个亚型的具体情况分析一下。


于是作者对这 5 个亚型的生存率进行了分析,结果发现 S1 最低,S3 最高(见下图 A)。同时,作者检测了一些已知的 HCC 基因在 5 个亚型中的的突变情况,发现 TP53 基因在 S1 亚型中突变率较高,而 CTNNB1 基因在 S3 亚型中的突变率明显高于其他亚型(见下图 B)。


3.jpg


那么通过这种方式分出来的结果到底是否可靠?为了验证这些亚型的结果,作者将这些亚型与临床数据进行整合分析。结果也证明了分类结果与临床观察结果一致(见表)。


4.jpg


分类方法和结果都没问题,自然要分析每个亚型的分子特征咯


首先从 S1 开始,作者注意 UGT2B17 基因在 S1 中频繁的出现缺失的现象,此外,S1 的脂代谢和氧化相关的酶的水平较低。


同时,DCDC2 基因的启动子区域表现出去甲基化的现象,PTEN,TP53,BAK 这些肿瘤抑制子的表达水平较低,而 BRAF 和 CCND1 表现出高水平的表达。这些结果也解释了为什么 S1 亚型生存率较低。


5.jpg


接下来,作者分析了 S2 和 S3 的情况,基于 COC 分析结果,作者有针对性的对 S2 和 S3 的数据集进行了分析。发现 6q27,7q36.3 等区域出现了低甲基化的现象,而这些位置都位于染色体的末端区域。


事实上,高甲基化会导致染色体稳定性提高。除甲基化外,HCC 的一些标志基因,如CPR,CYP2E1 及一些 miRNA 在 S3 中的表达也和其他亚型出现了明显差异。同时,在 S3 中 TERT(端粒延长关键基因)的表达也明显低于其他亚型。这些结果也解释了 S3 有更好的生存率的原因。


6.jpg


S1-S3 都分析完了,接下来就是 S4 和 S5 了。


在 S4 中,作者发现一个 E3 连接酶-MARCH11 的启动子区域出现了甲基化的现象。此外,miR-203 表达量在 S4 中明显更高,而 AXIN2 的表达量更低。同时,PTEN 在 S4 中的表达量也明显高于其他亚型,而 CCND1 则低于其他亚型(参照 fig2D,E)。


7.jpg


照着相同的套路,作者也分析了 S5 的分子特征。与 S5 相关度最高的仅包括 mRNA 的 3 个数据集合。并且特征基因在 S5 中所占的比例并不多。这些结果表明 S5 的分子变化情况很大程度在仅仅只是在转录水平发生了变化(看起来 S5 的分析好随意,一点都不走心的样子~。不过 S5 作为规模最小的亚型,也就勉强接受这么随意的分析吧)。


8.jpg


既然 S1-S5 的分子特征都分析完了,自然要总结一下咯。


9.jpg


尽管这些通过分子分析揭示了 5 个肝癌亚型的分子特征,这些数据仍然不能有效的用于临床分类。但是(转折来了,活不能白干啊。),作者为了能够进一步促进亚型分类,采用 AUC 及 ROC 对 DNA 甲基化,mRNA 等数据进行评估,进而探索各个亚型的标记基因。最终发现 MYBL2 (gene),SMOC2 (gene),SLC1A5 (gene),cg27046920 (CpG loci),以及F2(gene)能够分别作为 S1-S5 的标记基因。


10.jpg


事实上,这篇文章作者并没有做任何实验,完全是通过数据分析得到这些结果。作者所采用的分析方式也多种多样


最初从 TCGA 上收集到了大量的数据,甚至包括不同平台不同类型的数据集合。然后将这些数据集合进行整合分析(看起来应该是这篇文章最厉害的地方)。之后再对各个亚型的分子特征进行分析。


最终将肝癌分成了 5 个亚型,并找出了各个亚型的标记基因及分子特征。这篇文章完全就是通过对 TCGA 的数据进行整合分析所得出的结论。


最后得到了数个肝癌亚型的标志性基因。但是没有对这些基因的功能及作用机制进行深入分析。


如果通过免疫染色实验,蛋白含量分析等细胞生物学实验进一步验证这些基因的功能也许可以发个更高分的文章了。


此外,这仅仅只是对 TCGA 中肝癌相关数据分析,对其他肿瘤数据分析是不是也可以得到其余癌症的特征基因?本文作者是对肝癌亚型进行的分析,通过这种数据分析,或许也能得到特定的癌症标志基因。

分享