Plot hcluster tree(层次聚类树)
分析模块,输入FPKM矩阵,对样品进行聚类分析,输出样本聚类树状图。
分析模块默认对fpkm进行log2(fpkm+1)变换;样本间距离公式均为欧式距离;样本聚类方法为hcluster(complete算法)。
输入:
FPKM矩阵。
示例:
T4 T5 T6 T7 T8 T9
BM590_A0004 406.46 494.13 414.62 825.09 2678.41 555.67
BM590_A0005 605.70 755.09 643.55 1184.73 2980.14 568.58
BM590_A0015 382.41 435.68 435.09 667.24 1664.78 511.53
BM590_A0021 305.80 347.07 323.75 151.16 57.04 252.18
BM590_A0025 82.60 71.30 83.22 95.78 311.02 96.31
BM590_A0028 389.64 441.62 387.26 1020.02 5531.28 345.31
BM590_A0046 295.72 291.23 379.24 308.84 92.26 517.02
……
输出:
1、newick-formatted树文件,newick是一种树状的标准格式文件,可被多种建树软件识别。
注:如需对样本进行分组画图,可将该文件作为分析模块“Plot Tree using Newick tree format file”的输入,进行作图。支持多种树状图展示方式。
2、样本聚类树状图。
示例:
注:样本聚类树状图,利用树枝结构描述和比较多个样本间的相似性和差异关系。树枝长度代表样本间的距离,末端竖线表示样本聚在一起相似度较高。
分析模块引用R语言(v3.2.1)中的cor函数进行相关系数计算,dist函数进行距离计算,hclust函数进行样品间的聚类。