CCA Analysis(CCA分析)
RDA或者CCA[1]是基于对应分析发展而来的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。此分析是主要用来反映菌群与环境因子之间关系。RDA是基于线性模型,CCA是基于单峰模型。分析可以检测环境因子、样本、菌群三者之间的关系或者两两之间的关系。
1. RDA或CCA模型的选择原则:先用Species Table数据做DCA分析,看分析结果中Axis lengths的第一轴的大小,如果大于4.0,就应该选CCA,如果3.0-4.0之间,选RDA和CCA均可,如果小于3.0,RDA的结果要好于CCA。
2. 通过bioenv函数判断环境因子与样本群落分布差异的最大Pearson相关系数,通过最大相关系数得到环境因子子集。
3. 将样本物种分布表与环境因子或环境因子子集分别做CCA或者RDA分析。
4. 通过类似于ANOVA 的permutest分析来判断CCA或者RDA分析的显著性。
输入:
1、Species Table文件,由分析模块 "Summary the representation of taxonomic groups" 生成。
2、样本环境因子信息文件,示例:
!!注:输入的环境因子个数必须大于等于2,并且小于样本个数。
Sample Temperature Salinity DO pH
1410X 20.30 18.10 8.39 8.80
1501X 11.00 21.10 11.27 8.12
1504X 14.90 19.30 5.96 8.04
1507X 27.10 17.40 7.24 8.29
3、如果表示环境因子的射线太短或太长,通过设置如下所示的参数进行等比例放大或缩小。
输出:
decorana.txt:判断用CCA分析还是RDA分析的文件;
bioenv.txt:bioenv分析判断结果;
cca.txt:记录环境因子(Constrained)与非环境因子(Unconstrained)对样本群落分布的影响分别所占的比例;
permutest.cca.txt:permutest显著性检验结果;
cca.sites.xls.txt:各样本在各个排序轴上的值;
cca.biplot.xls.txt:各环境因子在各排序轴的计算值;
envfit.cca.txt:各环境因子对排序结果的相关性系数及显著性检验值;
cca.cont.xls.txt:各排序轴的特征值及解释度,一般取前两个排序轴作图;
图1. Multiple samples RDA/CCA analysis
图2. Multiple samples RDA/CCA analysis
图中数字表示样本名,不同颜色或形状表示不同环境或条件下的样本组;箭头表示环境因子;图2中蓝色下三角表示不同的细菌类型;物种与环境因子之间的夹角代表物种与环境因子间的正、负相关关系(锐角:正相关;钝角:负相关;直角:无相关性);由不同的样本向各环境因子做垂线,投影点越相近说明样本间该环境因子属性值越相似,即环境因子对样本的影响程度相当。
分析模块引用了R语言(v2.12.1)vegan包(v2.0-1)中的CCA分析。
相关文献如下所示:
[1] Sheik CS, Mitchell TW, Rizvi FZ, Rehman Y, Faisal M, et al. (2012) Exposure of Soil Microbial Communities to Chromium and Arsenic Alters Their Diversity and Structure. PLoS ONE 7(6): e40059. doi:10.1371/journal.pone.0040059.
Legendre, P. and Legendre, L. (1998) Numerical Ecology. 2nd English ed. Elsevier.
McCune, B. (1997) Influence of noisy environmental data on canonical correspondence analysis. Ecology 78, 2617-2623.
Palmer, M. W. (1993) Putting things in even better order: The advantages of canonical correspondence analysis. Ecology 74,2215-2230.
Ter Braak, C. J. F. (1986) Canonical Correspondence Analysis: a new eigenvector technique for multivariate direct gradient analysis. Ecology 67, 1167-1179.