KEGG statistic about KEGG annotation file(KEGG注释文件统计)
分析模块,输入KEGG注释信息文件,统计注释到通路(ko)中,对应的基因信息,输出统计结果。
!!对于主要物种,软件团队从KEGG网站上,下载并整理了对应物种的KEGG注释信息。访问,VG软件官方网站:(http://www.vgenomics.cn/),进行下载。
输入:
KEGG注释信息文件,其中,第一列为基因名,第二列为对应的K号。Kddddd表示,在所有同源物种中具有相似结构和功能的一类同源蛋白。如K04456表示丝氨酸/苏氨酸蛋白激酶。
示例:
BM590_A0001 K02313
BM590_A0003 K03629
BM590_A0005 K12972
BM590_A0006 K13896
BM590_A0007 K13895
……
输出:
通路(ko)中基因信息统计结果。
示例:
#Term Database ID Number Input Hyperlink
Pantothenate and CoA biosynthesis KEGG PATHWAY ko00770 9 BM590_A0097|BM590_A2072|BM590_A0677|BM590_A0358|BM590_A2054|BM590_A0310|BM590_A1382|BM590_B0909|BM590_A0357 http://www.genome.jp/kegg-bin/show_pathway?ko00770/K17723%09red/K00997%09red/K00859%09red/K00053%09red/K01687%09red/K00606%09red/K01918%09red/K00867%09red
RNA degradation KEGG PATHWAY ko03018 9 BM590_A0760|BM590_A2048|BM590_A2114|BM590_A1110|BM590_A0920|BM590_A1548|BM590_A1826|BM590_A1050|BM590_A0827 http://www.genome.jp/kegg-bin/show_pathway?ko03018/K08311%09red/K00970%09red/K08300%09red/K11927%09red/K03666%09red/K03628%09red/K12574%09red/K00937%09red/K04043%09red
beta-Alanine metabolism KEGG PATHWAY ko00410 9 BM590_B0872|BM590_B0990|BM590_B0759|BM590_B0890|BM590_B0891|BM590_A0217|BM590_B0640|BM590_A0310|BM590_A0357 http://www.genome.jp/kegg-bin/show_pathway?ko00410/K00128%09red/K17723%09red/K01918%09red/K01782%09red/K00822%09red
……
注:
其中,每一列的含义如下所示:
l #Term,代谢通路描述。
l Database ,数据库类型。
l ID,ko号,代谢通路名称,表示一个特定的生物路径。
l Number,该通路中的基因个数。
l Input,对应的具体基因,以“ | ”符号分隔。
l Hyperlink,超链接,链接到KEGG官网上对应的代谢通路图。
分析模块引用了KOBAS(v2.0-20150126)软件(http://kobas.cbi.pku.edu.cn)。
相关文献如下所示:
Xie, C., Mao, X., Huang, J., Ding, Y., Wu, J., Dong, S., Kong, L., Gao, G., Li, C. and Wei, L. (2011) KOBAS 2.0: a web server for annotation and identification of enriched pathways and diseases. Nucleic Acids Res, 39, W316-322.
KEGG 库(Kyoto encyclopedia of genes and genomes 数据库):京都基因和基因组百科全书,是系统分析基因功能、联系基因组信息和功能信息的知识库。利用KEGG数据库,可将基因按照参与的pathway通路或行使的功能分类。
!!更新KOBAS程序后台的KEGG数据库,通过KOBAS官网链接(http://kobas.cbi.pku.edu.cn/),下载最新的ko.db.gz文件,解压后覆盖软件根目录database文件夹下的同名文件。