Plot heatmap with tree(热图)
分析模块,输入差异基因FPKM矩阵,绘制热图,并对样品和基因进行聚类,输出可视化作图结果。Heatmap可以用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地将数据值的大小以定义的颜色深浅表示出来。
分析模块默认对fpkm进行log2(fpkm+1)变换;基因和样本间距离公式均为欧式距离;采用的聚类方法均为hcluster(complete算法)。
输入:
1、差异基因FPKM矩阵(过滤FPKM矩阵中,非差异表达基因对应的行)。
示例:
T4 T5 T6 T7 T8 T9
BM590_A0004 406.46 494.13 414.62 825.09 2678.41 555.67
BM590_A0005 605.70 755.09 643.55 1184.73 2980.14 568.58
BM590_A0015 382.41 435.68 435.09 667.24 1664.78 511.53
BM590_A0021 305.80 347.07 323.75 151.16 57.04 252.18
BM590_A0025 82.60 71.30 83.22 95.78 311.02 96.31
BM590_A0028 389.64 441.62 387.26 1020.02 5531.28 345.31
BM590_A0046 295.72 291.23 379.24 308.84 92.26 517.02
……
2、样品分组信息表(可选)。
示例:
T4 group1
T5 group1
T6 group1
T7 group2
T8 group2
T9 group2
输出:
1、绘制热图的数据(经过变换后,最终用于作图和计算的数据)。如果不进行变换,则与输入的FPKM矩阵一致。
示例:
T4 T5 T6 T7 T8 T9
BM590_A0004 8.67051462793045 8.9516635548292 8.6991212694417 9.69015515723112 11.3876996421428 9.12067852550685
BM590_A0005 9.24483950114555 9.56241416340833 9.33214846760773 10.2115598189921 11.541648413283 9.15375467876268
BM590_A0015 8.5827441552687 8.7704326467881 8.7684820980667 9.38422253293016 10.7019821608354 9.0014926423626
BM590_A0021 8.26115467261557 8.44323366394447 8.34318571544788 7.24944534108584 5.85897561429202 7.98401963308582
BM590_A0025 6.38543103719352 6.17592374206376 6.39609097039437 6.59663703410207 8.2854946963496 6.60451616514653
BM590_A0028 8.60969587286274 8.78992483126367 8.60087927282804 9.99579541103276 12.4336584607436 8.43592023697522
BM590_A0046 8.21295836272829 8.19096048095368 8.57076649652761 8.27537959625362 6.54318652456517 9.01686398912248
2、样本和基因聚类结果热图。
示例:
注:图中每列表示一个样本,每行表示一个基因,图中的颜色表示基因在该组样本中表达量的大小。具体表达量大小变化趋势请见左上方的Color Key。
左侧为基因聚类的树状图,右侧为基因的名称,两个基因分支离的越近,说明它们在所有样品中的表达趋势越接近。
上方为样本聚类的树状图,下方为样本的名称,两个样本分支离的越近,说明它们所有基因的表达模式越接近。
如果提供分组文件,那么,同一组内的样品,在上方用同一种颜色标识。
分析模块引用R语言(v3.2.1)中的cor函数进行相关系数计算,dist函数进行距离计算,hclust函数进行样品和基因间的聚类。