Select representative seqs(获得对应分类学水平代表序列)
分析模块输入OTU代表序列文件、OTU Table文件、OTU分类学注释文件。根据选定的分类学水平,输出对应水平的代表序列文件。
假设,为了获得属水平的代表序列。如果,多个OTU对应同一个属,则选取在所有样品中,丰度最高的OTU代表序列作为对应属水平的代表序列。
输入:
1、fasta格式的OTU代表序列文件:
>OTU1
GTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGA ……
>OTU2
GTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTG ……
……
2、OTU Table文件:
OTU ID 10 11 12
OTU1 10842 7265 11259
OTU2 6660 5505 7994
OTU3 3212 1769 7230
OTU4 4143 2548 2328
3、分类学注释文件:
OTU1 d__Bacteria; p__Proteobacteria; c__Alphaproteobacteria; o__Rhizobiales; f__Bradyrhizobiaceae; g__Bradyrhizobium
OTU2 d__Bacteria; p__Firmicutes; c__Bacilli; o__Lactobacillales; f__Streptococcaceae; g__Lactococcus
OTU3 d__Bacteria; p__Proteobacteria; c__Alphaproteobacteria; o__Sphingomonadales; f__Sphingomonadaceae; g__Sphingomonas
OTU4 d__Bacteria; p__Actinobacteria; c__Actinobacteria; o__Actinomycetales; f__Micromonosporaceae; g__Rugosimonospora
输出:
对应水平的代表序列文件:
>Bradyrhizobium
GTGGGGAATATTGGACAATGGGCGCAAGC……
>Lactococcus
GTAGGGAATCTTCGGCAATGGACGAAAGT……
>Sphingomonas
GTGGGGAATATTGGACAATGGGCGAAAGC……
>Rugosimonospora
GTGGGGAATATTGCACAATGGGCGGAAGC……
……