Batch Mode: GO Enrichment Analysis(批处理:GO富集分析)
分析模块,输入差异基因列表HTML文件(链接所有样品或分组之间的差异基因列表)、或子表达模式基因列表HTML文件(链接所有子表达模式基因列表),由分析模块“Batch Mode: Retrieve Diff Genes list”生成。另外,提供全部基因列表文件和GO注释信息文件。分析模块以差异基因作为foreground,所有基因作为background,进行差异基因GO富集分析,输出富集结果HTML文件(链接所有GO富集结果)。
分析模块,使用软件goatools(https://github.com/tanghaibao/goatools)进行富集分析,使用方法为Fisher精确检验。为控制计算的假阳性率,使用4种多重检验方法(Bonferroni, Holm, Sidak 和false discovery rate) 对p值进行了校正,通常情况下,当经过校正后的p值≤0.05时,认为此GO功能存在显著富集情况。
模块为分析模块“GO Enrichment Analysis”的批处理版本,对输入HTML文件中包含的链接文件进行批处理,输出相应处理后的HTML结果文件(链接批处理后的文件)。
!!对于主要物种,软件团队从Ensemble网站上,下载并整理了对应物种的GO注释信息。访问,VG软件官方网站:(http://www.vgenomics.cn/),进行下载。
输入:
1、差异基因列表HTML文件(链接所有样品或分组之间的差异基因列表),由分析模块“Batch Mode: Retrieve Diff Genes list”生成。
示例:
2、全部基因列表文件,可由分析模块“Fetch all genes(row names) list from matrix”通过原始的FPKM矩阵或Count矩阵获得。
示例:
BM590_A0001
BM590_A0002
BM590_A0003
BM590_A0004
BM590_A0005
BM590_A0006
BM590_A0007
BM590_A0008
BM590_A0009
……
3、对应的GO注释信息文件,其中,第一列为基因名,第二列为对应的GO注释结果(以“ ; ”符号分隔)。
示例:
BM590_A0001 GO:0003688;GO:0005524;GO:0006275;GO:0006270;GO:0005737
BM590_A0002 GO:0003677;GO:0006260;GO:0055114;GO:0005737;GO:0003887
BM590_A0003 GO:0003697;GO:0006281;GO:0005524;GO:0006260;GO:0009432;GO:0005737
BM590_A0004 GO:0008152;GO:0003824
BM590_A0005 GO:0051287;GO:0055114
……
输出:
差异基因GO富集分析结果HTML文件(链接所有GO富集分析的结果)。
示例:
关于HTML链接的文件内容和格式。
*List文件参考分析模块“Batch Mode: Retrieve Diff Genes list”的帮助文档。
*.GO_enrich文件参考分析模块“GO Enrichment Analysis”的帮助文档。
分析模块引用了goatools(v0.5.7)软件(https://github.com/tanghaibao/goatools/)。
相关文献如下所示:
Haibao Tang et al. (2015). GOATOOLS: Tools for Gene Ontology. Zenodo. 10.5281/zenodo.31628.
GO(Gene Ontology) 是基因本体论联合会建立的数据库,适用于各物种,对基因和蛋白功能进行限定和描述。利用 GO 数据库,可以将基因按照它们参与的生物学过程、构成细胞的组分,实现的分子功能等进行分类。因此GO注释更加便于我们理解基因背后所代表的生物学意义。
!!更新GO结构关系和描述信息数据库,通过Gene Ontology官网链接(http://geneontology.org/ontology/go-basic.obo),下载最新的go-basic.obo文件,覆盖软件根目录database文件夹下的同名文件。