做肿瘤研究的过程中,生存分析是一个很常见的研究分析,研究者可以根据生存分析的结果判断某个因素,比如基因表达,对患者预后生存的影响。
TCGA这个肿瘤研究的宝库包含了多个肿瘤的生存数据,一直以来都是数据挖掘的宝库。对于想要研究肿瘤的医学生来说,不会R语言编程是个痛点,今天给大家介绍几款在线小工具供大家参考学习,方便大家研究基因表达与生存的关系。
1
OncoLnc 01
进入网站后,网站提示可以对TCGA的mRNA、miRNA、lncRNA进行分析,在主页那个大大的框框内,输入基因名,则可以显示一个基因在多个肿瘤中对生存分析结果。
02
应用示例:(以TP53为例)
03
内容简要解读
❒ Cancer
肿瘤,光标放在蓝色点点的i上面可以查看每个肿瘤的全称;
❒ CoxCoefficent
基于多变量回归分析检验而得到的结果,正Cox系数表明基因的高表达会增加死亡的风险,而负Cox系数则相反;
❒ P-Value
同样也是基于多变量回归检验的结果;
❒ FDR-Corrected
对单个肿瘤的p值进行FDR校正后的结果;
❒ Rank
研究者认为研究某个基因在多个肿瘤中对预后的影响程度时,使用p值进行比较是不靠谱的,而使用Rank后的等级强度比较则是一个简单也更好的方式。数值越小说明越重要;
❒ Median Expression (第一个)
是对单个基因在所用肿瘤中进行normalized后的中位表达值;
❒ Median Expression (第二个)
是对单个基因在单个肿瘤中normalized后的中位表达值;
❒ Plot Kaplan? 是否进行作图。
下面我们点击 Plot Kaplan :可以对高低表达的两组进行自由划分,推荐33.33:33.33或者25:25,当然如果病人太少的话,还是做中位生存分析50:50比较靠谱。不过以笔者的经验,分组时最低比例也不要低于20%,不然结果容易出现偏倚,误差较大,做科研还是不能为了结果好而结果好嘛。
输入两组的比例后,点击submit跳转出结果:
很遗憾TP53在肝癌里的四分位生存分析结果并不显著。
但有一个问题就是生存分析的结果显著与否与分组时病人的分组信息及病人的预后信息有关,当前最新的TCGA的预后信息已经更新到了release.10版本,笔者在分析的实践过程中发现,有时候一个分析用release.4版本的生存数据(从GDAC)结果显著,但用release.9(从Xena下载)结果可能就不显著了。所以,在此另外再推荐两个工具进行分析。
2
GEPIA
01
http://gepia.cancer-pku.cn/index.html
02
操作过程
然后就会跳出下载结果pdf的图啦
在“95% Confidence Interval”选择NO就可以去掉虚线,只显示两条线啦!
3
TIMER
01
与上面两个工具不同的是,TIMER可以矫正一些因素,比如性别、年龄等等。
此处需要注意的是,如果要做基因的生存分析,那么不需要在“Immune Infiltrates”选择任何细胞类型,如果选择了会在右下角跳出的结果中显示不同免疫细胞浸润比例的生存曲线(所以,选择了也没关系,对工具理解不熟悉的时候,不选择它就是了)。
好啦,网站工具的使用就介绍到这里,祝大家都能拿到符合预期的结果,文章顺利发表。