Plot hcluster tree(层次聚类树)
利用树枝结构描述和比较多个样本间的相似性和差异关系。首先使用描述群落组成关系和结构的算法计算样本间的距离,即根据beta多样性距离矩阵进行层次聚类(Hierarchical cluatering)分析[1],使用非加权组平均法UPGMA(Unweighted pair group method with arithmetic mean)算法构建树状结构,得到树状关系形式用于可视化分析。
输入:
样本距离矩阵文件,由分析模块 "Generate distance matrix from OTU Table in biom format" 生成。
Bio1 Bio2 Bio3 Bio4 Bio5
Bio1 0 0.1984 0.238883 0.222763 0.259351
Bio2 0.1984 0 0.127324 0.153768 0.160351
Bio3 0.238883 0.127324 0 0.194398 0.147496
Bio4 0.222763 0.153768 0.194398 0 0.20812
Bio5 0.259351 0.160351 0.147496 0.20812 0
其他参数默认。
输出:
newick-formatted树文件,newick是一种树状的标准格式文件,可被多种建树软件识别,例如:PHYLIP、TREEVIEW、ARB。
注:如需对样本进行分组画图,可将该文件作为高级分析中模块"Plot Tree using Newick tree format file"的输入,支持多种树状图展示方式。
样本相似度树状图:
注:多样本相似度树状图,利用树枝结构描述和比较多个样本间的相似性和差异关系。树枝长度代表样本间的距离,末端竖线表示样本聚在一起相似度较高。
分析模块引用R语言(v2.12.1)进行相关的作图。
相关文献如下所示:
[1] Xiao-Tao Jiang ,Xin Peng, et al.Illumina Sequencing of 16S rRNA Tag Revealed Spatial Variations of Bacterial Communities in a Mangrove Wetland. Microb Ecol (2013) 66:96–104.DOI 10.1007/s00248-013-0238-8.