Create Sample Correlation Matrix(样品相关性系数计算)
分析模块,输入FPKM矩阵,进行相关性系数分析。样品间基因表达水平相关性是检验试验可靠性和样本选择是否合理的重要指标。相关性系数越接近1,表明样品之间表达模式的相似度越高,样品间的差异基因也越少。样品间的相关性反应了样品间的相似度,即不同处理或组织的样品在表达水平方面的相似度。生物学重复间的样品的相关系数应大于生物学重复外的样品的相关系数。相关系数的计算方法有三种:A. Pearson correlation; B. Spearman rank correlation; C. Kendall’s τ。
输入:
1、FPKM矩阵(FPKM Matrix)。
示例:
T4 T5 T6 T7 T8 T9
BM590_A0001 390.11 379.54 386.52 288.73 372.47 327.73
BM590_A0002 350.06 310.51 328.78 175.32 249.21 210.62
BM590_A0003 222.52 219.54 209.39 174.45 97.20 240.38
BM590_A0004 406.46 494.13 414.62 825.09 2678.41 555.67
BM590_A0005 605.70 755.09 643.55 1184.73 2980.14 568.58
BM590_A0006 306.72 311.16 351.08 282.26 204.19 310.56
……
2、样品分组信息表(可选)。
示例:
T4 group1
T5 group1
T6 group1
T7 group2
T8 group2
T9 group2
输出:
1、样本间相关系数热图。
示例:
注:如果提供分组文件,那么,同一组内的样品,在上方和左方,用同一种颜色标识。
2、样本间相关系数矩阵。
示例:
T4 T5 T6 T7 T8 T9
T4 1 0.980267121061908 0.989702507965223 0.588861743971407 0.592989580812111 0.658682346369658
T5 0.980267121061908 1 0.98607374755974 0.587386501154351 0.595003551006885 0.676990163241074
T6 0.989702507965223 0.98607374755974 1 0.586922106842373 0.587649536735791 0.702699562941688
T7 0.588861743971407 0.587386501154351 0.586922106842373 1 0.953749773519016 0.676021042137711
T8 0.592989580812111 0.595003551006885 0.587649536735791 0.953749773519016 1 0.65034522903531
T9 0.658682346369658 0.676990163241074 0.702699562941688 0.676021042137711 0.65034522903531 1
分析模块引用R语言(v3.2.1)中的cor函数进行相关系数计算,hclust函数进行样品间的聚类。