分析模块,输入FASTA格式序列文件,输出统计信息。
输入:
FASTA格式的序列数据文件。
示例:
>OTU1
GTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCG ……
>OTU2
GTAGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCG ……
>OTU3
GTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCG ……
……
输出:
统计信息文件。
示例:
GC_content 54.9
len_N50 449
len_max 451
len_mean 439
len_median 449
len_min 425
num_A 12097
num_C 9885
num_G 15955
num_N 0
num_T 9093
num_bp 47030
num_bp_not_N 47030
num_seq 107
包含的信息:
Lengths: n50, min, max, median and average
Number of base pairs: A, C, G, T, N, Total and Total_not_N
Number of sequences
GC content in %
关于FASTA格式文件,请参考维基百科:(https://en.wikipedia.org/wiki/FASTA_format)。