热图

Plot heatmap with tree（热图）

　　分析模块，输入差异基因FPKM矩阵，绘制热图，并对样品和基因进行聚类，输出可视化作图结果。Heatmap可以用颜色变化来反映二维矩阵或表格中的数据信息，它可以直观地将数据值的大小以定义的颜色深浅表示出来。

　　分析模块默认对fpkm进行log2（fpkm+1）变换；基因和样本间距离公式均为欧式距离；采用的聚类方法均为hcluster（complete算法）。

　　输入：

1、差异基因FPKM矩阵（过滤FPKM矩阵中，非差异表达基因对应的行）。

　　示例：

T4 T5 T6 T7 T8 T9

BM590_A0004 406.46 494.13 414.62 825.09 2678.41 555.67

BM590_A0005 605.70 755.09 643.55 1184.73 2980.14 568.58

BM590_A0015 382.41 435.68 435.09 667.24 1664.78 511.53

BM590_A0021 305.80 347.07 323.75 151.16 57.04 252.18

BM590_A0025 82.60 71.30 83.22 95.78 311.02 96.31

BM590_A0028 389.64 441.62 387.26 1020.02 5531.28 345.31

BM590_A0046 295.72 291.23 379.24 308.84 92.26 517.02

……

2、样品分组信息表（可选）。

　　示例：

T4 group1

T5 group1

T6 group1

T7 group2

T8 group2

T9 group2

　　输出：

1、绘制热图的数据（经过变换后，最终用于作图和计算的数据）。如果不进行变换，则与输入的FPKM矩阵一致。

　　示例：

T4 T5 T6 T7 T8 T9

BM590_A0004 8.67051462793045 8.9516635548292 8.6991212694417 9.69015515723112 11.3876996421428 9.12067852550685

BM590_A0005 9.24483950114555 9.56241416340833 9.33214846760773 10.2115598189921 11.541648413283 9.15375467876268

BM590_A0015 8.5827441552687 8.7704326467881 8.7684820980667 9.38422253293016 10.7019821608354 9.0014926423626

BM590_A0021 8.26115467261557 8.44323366394447 8.34318571544788 7.24944534108584 5.85897561429202 7.98401963308582

BM590_A0025 6.38543103719352 6.17592374206376 6.39609097039437 6.59663703410207 8.2854946963496 6.60451616514653

BM590_A0028 8.60969587286274 8.78992483126367 8.60087927282804 9.99579541103276 12.4336584607436 8.43592023697522

BM590_A0046 8.21295836272829 8.19096048095368 8.57076649652761 8.27537959625362 6.54318652456517 9.01686398912248

2、样本和基因聚类结果热图。

　　示例：

注：图中每列表示一个样本，每行表示一个基因，图中的颜色表示基因在该组样本中表达量的大小。具体表达量大小变化趋势请见左上方的Color Key。

左侧为基因聚类的树状图，右侧为基因的名称，两个基因分支离的越近，说明它们在所有样品中的表达趋势越接近。

上方为样本聚类的树状图，下方为样本的名称，两个样本分支离的越近，说明它们所有基因的表达模式越接近。

如果提供分组文件，那么，同一组内的样品，在上方用同一种颜色标识。

分析模块引用R语言（v3.2.1）中的cor函数进行相关系数计算，dist函数进行距离计算，hclust函数进行样品和基因间的聚类。

下一篇：PE 数据质量剪切

上一篇： PCA分析