Make Distance Boxplots(组间距离关系盒形图)
分析模块,输入样品间距离矩阵和样品分组信息表,比较不同样品分组的组内和组间的距离分布差异,进行Boxplot作图,同时采用two-sample t-tests判断样本组间的显著性差异。
箱式图的作用:识别数据异常值;粗略估计和判断数据特征;比较几批数据的形状,同一数轴上,几批数据的箱形图并行排列,几批数据的中位数、尾长、异常值、分布区间等形状信息一目了然。
箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。 简单箱线图由五部分组成,分别是最小值、中位数、最大值和两个四分位数。
输入:
1、样品间的距离矩阵。
示例:
T4 T5 T6 T7 T8 T9
T4 0 13.309806490621 12.8328319481701 44.2547040240155 103.615826419947 34.7080813217134
T5 13.309806490621 0 14.2688425759815 43.6970358825701 101.844088884956 35.9702984636113
T6 12.8328319481701 14.2688425759815 0 42.8295191815047 104.165822252793 31.1348591290974
T7 44.2547040240155 43.6970358825701 42.8295191815047 0 82.0937169482593 33.0949750872802
T8 103.615826419947 101.844088884956 104.165822252793 82.0937169482593 0 102.176434778739
T9 34.7080813217134 35.9702984636113 31.1348591290974 33.0949750872802 102.176434778739 0
2、样品分组信息表。
示例:
T4 group1
T5 group1
T6 group1
T7 group2
T8 group2
T9 group2
输出:
样本距离箱线分析图:
示例:
注:第一四分位数 (Q1),又称“下四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
第三四分位数 (Q3),又称“上四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。