UTAX分类学注释

Usearch utax command assign taxonomy(UTAX分类学注释)


分析模块,输入OTU代表序列,与数据库比对,进行分类学分析,得到OTU分类学结果文件。

分析模块封装了Usearch中的Utax命令,Utax基于Kmer的方法进行分类学分析,支持数据库如下所示:

16S    RDP trainset 15

ITS    UNITE v7

受限于电脑性能,如需支持更多,更大的数据库,建议使用B/S(服务器/浏览器)架构的分析系统,网页端操作。


  输入:

       OTU代表序列文件:

>OTU1

GTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCG ……

>OTU2

GTAGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCG ……

>OTU3

GTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCG ……

……


  输出:

       1、Qiime格式的分类学注释结果文件:

OTU1        d__Bacteria; p__Proteobacteria; c__Alphaproteobacteria; o__Rhizobiales; f__Bradyrhizobiaceae

OTU3        d__Bacteria; p__Proteobacteria; c__Alphaproteobacteria; o__Sphingomonadales; f__Sphingomonadaceae

OTU2        d__Bacteria; p__Firmicutes; c__Bacilli; o__Lactobacillales; f__Streptococcaceae; g__Lactococcus


      2、RDP格式的分类学注释结果文件:

OTU1                 Root          rootrank   1.0    Bacteria   domain     1.00 "Proteobacteria"        phylum     1.00 Alphaproteobacteria         class 1.00 Rhizobiales       order         0.99 Bradyrhizobiaceae   family       0.91 Bradyrhizobium        genus        0.71

OTU3                 Root          rootrank   1.0    Bacteria   domain     1.00 "Proteobacteria"        phylum     1.00 Alphaproteobacteria         class 1.00 Sphingomonadales   order         0.94 Sphingomonadaceae        family       0.92 Sphingomonas genus        0.82

OTU2                 Root          rootrank   1.0    Bacteria   domain     1.00 Firmicutes         phylum     1.00 Bacilli       class 1.00         Lactobacillales order         0.99 Streptococcaceae     family       0.99 Lactococcus     genus        0.98


分析模块引用了Usearch v8.1.1861软件http://www.drive5.com/usearch/manual/)。


    相关文献如下所示:

USEARCH and UCLUST algorithms

Edgar,RC (2010) Search and clustering orders of magnitude faster than BLAST, Bioinformatics 26(19), 2460-2461. doi: 10.1093/bioinformatics/btq461

UCHIME algorithm

Edgar,RC, Haas,BJ, Clemente,JC, Quince,C, Knight,R (2011) UCHIME improves sensitivity and speed of chimera detection, Bioinformatics doi: 10.1093/bioinformatics/btr381 [PMID 21700674].

UPARSE algorithm

Edgar, R.C. (2013) UPARSE: Highly accurate OTU sequences from microbial amplicon reads, Nature Methods [Pubmed:23955772, dx.doi.org/10.1038/nmeth.2604].


分享
下一篇:RDP分类学注释