——sankey分析代码 |
桑基图(sankey)是一种数据流图,每条边代表一条数据流,宽度代表数据流的大小。一套数据集可能有多重属性,每层属性之间有交叉,就可以用这种图来展示。一般应用场景:分组与基因为多对多关系,展示高频突变基因所处的分组;miRNA和靶基因的关系;人群按性别、年龄、家族史等特征分组,展示不同分组得癌症的规律。
数据要求:
多个分组及其关系,包括且不限于基因表达、突变。
下游分析:
1. 补充展示部分的已有相关研究
2. 解释展示部分对研究课题的意义
图形示例:
1.多个分组相关关系桑基图
图注:每一列为不同分组,连线为相关性。
应用示例:
文献一:The whole-genome landscape of medulloblastoma subtypes
髓母细胞瘤亚型的全基因组图谱(于2017年7月发表在Nature.,影响因子43.070)
文献采用桑基图来总结最常见突变基因及其亚群分布情况。
文献二:Co-expressed genes enhance precision of receptor statusidentification in breast cancer patients
共表达基因提高乳腺癌患者受体状态识别的准确性(于2018年12月发表在Breast Cancer Res Treat. ,影响因子3.471)
文献采用桑基图来展示不同免疫组织化学分组下患者的基因共表达情况。