Report all input Gene -> GO Relations(根据GO注释结果,列出所有基因与GO关系)
分析模块,输入基因名列表和GO注释信息文件,输出基因名列表文件中,与基因关联的所有GO信息。
!!对于主要物种,软件团队从Ensemble网站上,下载并整理了对应物种的GO注释信息。访问,VG软件官方网站:(http://www.vgenomics.cn/),进行下载。
输入:
1、基因名列表文件。
示例:
BM590_A1208
BM590_A2108
BM590_A0215
BM590_A1759
BM590_A1256
BM590_A2152
BM590_A2107
BM590_A1854
BM590_A1530
BM590_A2143
……
2、对应的GO注释信息文件,其中,第一列为基因名,第二列为对应的GO注释结果(以“ ; ”符号分隔)。
示例:
BM590_A0001 GO:0003688;GO:0005524;GO:0006275;GO:0006270;GO:0005737
BM590_A0002 GO:0003677;GO:0006260;GO:0055114;GO:0005737;GO:0003887
BM590_A0003 GO:0003697;GO:0006281;GO:0005524;GO:0006260;GO:0009432;GO:0005737
BM590_A0004 GO:0008152;GO:0003824
BM590_A0005 GO:0051287;GO:0055114
……
输出:
基因列表文件中,与输入基因关联的所有GO信息结果。
示例:
#id GO_term namespace description level(shortest distance from root node) depth(longest distance from root node)
BM590_A1759 GO:0080090 biological_process regulation of primary metabolic process level-03 depth-03
BM590_A1759 GO:0019222 biological_process regulation of metabolic process level-02 depth-02
BM590_A2143 GO:0008270 molecular_function zinc ion binding level-06 depth-06
BM590_A2108 GO:0005198 molecular_function structural molecule activity level-01 depth-01
BM590_A2107 GO:0005198 molecular_function structural molecule activity level-01 depth-01
注:
每一列,从左到右,依次为:基因名称;GO编号;GO从属的功能三大类(分子功能、细胞组成、生物过程);GO功能描述; GO等级(与根节点最短路径的距离);GO深度(与根节点最长路径的距离)。
这里,cellular_component,biological_process,molecular_function三大分支的GO等级为:level-00。
分析模块引用了goatools(v0.5.7)软件(https://github.com/tanghaibao/goatools/)。
相关文献如下所示:
Haibao Tang et al. (2015). GOATOOLS: Tools for Gene Ontology. Zenodo. 10.5281/zenodo.31628.
GO(Gene Ontology) 是基因本体论联合会建立的数据库,适用于各物种,对基因和蛋白功能进行限定和描述。利用 GO 数据库,可以将基因按照它们参与的生物学过程、构成细胞的组分,实现的分子功能等进行分类。因此GO注释更加便于我们理解基因背后所代表的生物学意义。
!!更新GO结构关系和描述信息数据库,通过Gene Ontology官网链接(http://geneontology.org/ontology/go-basic.obo),下载最新的go-basic.obo文件,覆盖软件根目录database文件夹下的同名文件。