按长度过滤fasta序列

Filter sequences by length(按长度过滤fasta序列)


  分析模块,根据限定的序列长度信息(Minimal length and Maximum length),输出指定长度范围内的序列。

  注:扩增子测序中,通常在MiSeq PE两端数据组装之后,OTU聚类之前,过滤长度太短的测序片段。一般情况下,用于过滤参考序列中,长度过短的序列。


  输入:

       FASTA格式的序列数据文件:

>seq1

TCATTTAATGAC

>seq2

ATGGC

>seq3

TCACATGATGCCG

>seq4

ATGGAAGC

设置Minimal length10,   Maximum length0


  输出:

  序列长度信息文件:

>seq1

TCATTTAATGAC

>seq3

TCACATGATGCCG

关于FASTA格式文件,请参考维基百科:https://en.wikipedia.org/wiki/FASTA_format

分享