我们开发了利用机器学习算法根据癌症的干性指数进行肿瘤分型分类研究,旨在从一个新的角度来研究癌症不同亚型差异的原因及特定药物治疗方案。
1.基于DNA甲基化芯片和表达谱RNA-seq数据(或芯片),运用one-class logistic regression(OCLR)机器学习算法,计算肿瘤的干细胞指数;
2.比较亚型间干性指数的高低水平;
3.不同亚型以及临床信息与干细胞指数的相关性;
4.Cox单元和多元回归分析mRNAsi,mDNAsi以及临床性状与生存的关系。
5.不同亚型中干细胞指数生存分析和无病生存率(relapse-free survival),找出与生存相关的亚型;
6.分析该亚型的干性指数与生存的关系,并确定区分阈值;
7.根据阈值分组,分析差异基因;
8.从差异基因中利用cox回归、lasso筛选与预后有关的基因集;
9.分析这些关键基因的调控miRNA、lncRNA等
10.在各分型中,干性指数与Immune Score (免疫细胞在肿瘤组织中的浸润情况) 、PD-L1的关联分析。
11.在各分子分型中,干性指数与各类免疫细胞丰度的关联分析
12.在各分子分型中,干性指数与各类免疫细胞激活状态和非激活状态丰度的关联分析。
13.生存有关亚型的干性指数高低对应的药物分子抑制剂。