Filter sequences by length(按长度过滤fasta序列)
分析模块,根据限定的序列长度信息(Minimal length and Maximum length),输出指定长度范围内的序列。
注:扩增子测序中,通常在MiSeq PE两端数据组装之后,OTU聚类之前,过滤长度太短的测序片段。一般情况下,用于过滤参考序列中,长度过短的序列。
输入:
FASTA格式的序列数据文件:
>seq1
TCATTTAATGAC
>seq2
ATGGC
>seq3
TCACATGATGCCG
>seq4
ATGGAAGC
设置Minimal length:10, Maximum length:0。
输出:
序列长度信息文件:
>seq1
TCATTTAATGAC
>seq3
TCACATGATGCCG
关于FASTA格式文件,请参考维基百科:https://en.wikipedia.org/wiki/FASTA_format