Construt phylogenetic tree by OTU represent seqs(代表序列系统发育树)
在分子进化研究中,系统发生的推断能够揭示出有关生物进化过程的顺序,了解生物进化历史和机制,可以通过某一分类水平上序列间碱基的差异构建进化树[1]。
通过选择OTU代表序列或某一水平上分类信息对应的序列,使用Muscle软件进行全局序列比对,接着使用FastTree软件根据最大似然法构建进化树。
输入:
fasta格式的OTU代表序列文件,与OTU Table中的每一个OTU所对应。
输出:
newick-formatted树文件;newick是树状标准格式文件,可被多种建树软件识别,例如:PHYLIP、TREEVIEW、ARB。
示例:
newick 格式:
(((SEQ1:0.02120,(SEQ2:0.09111,SEQ3:0.04491)node1:0.00097)node2:0.00194,(SEQ4:0.03160,SEQ5:0.04378)node3:0.00365)node4:0.00188,SEQ6:0.00881)node5:0.00739;
其中括号内聚到一起相似的树枝,冒号后为距离。
分析模块引用了Muscle(v3.8.31)和FastTree(v2.1.8)。
相关文献如下所示:
[1] Laurent Philippot, et al. Loss in microbial diversity affects nitrogen cycling in soil. The ISME Journal (2013) 7, 1609–1619; doi:10.1038/ismej.2013.34.
Edgar, R.C. (2004) MUSCLE: multiple sequence alignment with high accuracy and high throughput Nucleic Acids Res. 32(5):1792-1797 .
Edgar, R.C. (2004) MUSCLE: a multiple sequence alignment method with reduced time and space complexity BMC Bioinformatics, (5) 113.
Price MN, Dehal PS, Arkin AP (2010) FastTree 2 – Approximately Maximum-Likelihood Trees for Large Alignments. PLoS ONE 5(3): e9490. doi:10.1371.journal.pone.0009490.