Batch Mode: Add KEGG Annotation(批处理:差异表达分析结果添加KEGG注释信息)
分析模块,输入差异表达分析的HTML结果文件(链接所有样品或分组之间的差异表达分析结果),可由分析模块“Differential Expression Analysis”和“Parse Cuffdiff results”生成,或输入过滤后的差异表达HTML结果文件(链接所有过滤后的差异结果),由分析模块“Batch Mode: Filter DE Analysis Result”生成。其中,HTML文件链接的文件,对应的第一列必须为基因名。分析模块,将在列尾追加对应基因的KEGG注释信息。
模块为分析模块“Add KEGG Annotation”的批处理版本,对输入HTML文件中包含的链接文件进行批处理,输出相应处理后的HTML结果文件(链接批处理后的文件)。
!!对于主要物种,软件团队从KEGG网站上,下载并整理了对应物种的KEGG注释信息。访问,VG软件官方网站:(http://www.vgenomics.cn/),进行下载。
输入:
1、差异表达分析的HTML结果文件(链接所有样品或分组之间的差异表达分析结果),或输入过滤后的差异表达HTML结果文件(链接所有过滤后的差异结果)。
示例(edgeR):
2、对应的KEGG注释信息文件,其中,第一列为基因名,第二列为对应的K号。Kddddd表示,在所有同源物种中具有相似结构和功能的一类同源蛋白。如K04456表示丝氨酸/苏氨酸蛋白激酶。
示例:
BM590_A0001 K02313
BM590_A0003 K03629
BM590_A0005 K12972
BM590_A0006 K13896
BM590_A0007 K13895
……
输出:
列尾追加对应基因KEGG注释信息的HTML结果文件(链接所有添加KEGG注释信息的结果)。
示例:
关于HTML链接的文件内容和格式。
*.DE_results文件参考分析模块“Differential Expression Analysis”、“Parse Cuffdiff results”的帮助文档。
*.Fi文件参考分析模块“Filter DE Analysis Result”的帮助文档。
*.KEGG_Anno文件参考分析模块“Add KEGG Annotation”的帮助文档。
分析模块引用了KOBAS(v2.0-20150126)软件(http://kobas.cbi.pku.edu.cn)。
相关文献如下所示:
Xie, C., Mao, X., Huang, J., Ding, Y., Wu, J., Dong, S., Kong, L., Gao, G., Li, C. and Wei, L. (2011) KOBAS 2.0: a web server for annotation and identification of enriched pathways and diseases. Nucleic Acids Res, 39, W316-322.
KEGG 库(Kyoto encyclopedia of genes and genomes 数据库):京都基因和基因组百科全书,是系统分析基因功能、联系基因组信息和功能信息的知识库。利用KEGG数据库,可将基因按照参与的pathway通路或行使的功能分类。
!!更新KOBAS程序后台的KEGG数据库,通过KOBAS官网链接(http://kobas.cbi.pku.edu.cn/),下载最新的ko.db.gz文件,解压后覆盖软件根目录database文件夹下的同名文件。