LEfSe formatting(格式化LEfSe输入)
分析模块生成LEfSe分析的输入配置文件,需提供:样品分组条件、样品子分组条件、样品丰度和分类学信息。
输入:
1、包含分类学信息的biom格式的OUT Table文件,可通过分析模块 "Convert table to biom with taxonomy assignment information" 得到。
2、class design文件,定义样品的class分类,即生物条件或类群。
示例:
Bio1 mucosal
Bio2 mucosal
Bio3 mucosal
Bio4 mucosal
Bio5 mucosal
Bio6 mucosal
Bio7 non_mucosal
Bio8 non_mucosal
Bio9 non_mucosal
Bio10 non_mucosal
3、subclass design文件(可选),定义样品的subclass分类。默认分组条件与class design文件一致。该文件需确保sample->subclass->class之间的包含对应关系,举例说明:Bio1属于oral,Bio1属于mucosal,那么oral就属于mucosal,这样的话,Bio9就不能属于oral。
示例:
Bio1 oral
Bio2 oral
Bio3 gut
Bio4 gut
Bio5 gut
Bio6 gut
Bio7 skin
Bio9 skin
Bio8 nasal
Bio10 nasal
输出:
LEfSe分析输入配置文件。
注:分类学等级对应的结果依赖于进行分类学注释时所采用的数据库。不同的数据库,等级对应的结果不同。在选择Taxonomy level的时候,根据需要进行选择,一般到属水平。
例如,对于Greengenes 数据库,使用如下的分类学等级: Level 1 = Kingdom (e.g Bacteria), Level 2 = Phylum (e.g Actinobacteria), Level 3 = Class (e.g Actinobacteria), Level 4 = Order (e.g Actinomycetales), Level 5 = Family (e.g Streptomycetaceae), Level 6 = Genus (e.g Streptomyces), Level 7 = Species (e.g mirabilis). "