批处理:KEGG富集分析

Batch Mode: KEGG Enrichment Analysis(批处理:KEGG富集分析)


  分析模块,输入差异基因列表HTML文件(链接所有样品或分组之间的差异基因列表)、或子表达模式基因列表HTML文件(链接所有子表达模式基因列表),由分析模块“Batch Mode: Retrieve Diff Genes list”生成。另外,提供全部基因列表文件和KEGG注释信息文件。分析模块以差异基因作为foreground,所有基因作为background,进行差异基因KEGG富集分析,输出富集结果HTML文件(链接所有KEGG富集结果)。

  分析模块,使用软件KOBAS(http://kobas.cbi.pku.edu.cn)进行富集分析,默认使用方法为超几何检验/Fisher精确检验。通常情况下,当经过校正后的p值≤0.05时,认为该ko通路显著富集。

      !!对于主要物种,软件团队从KEGG网站上,下载并整理了对应物种的KEGG注释信息。访问,VG软件官方网站:(http://www.vgenomics.cn/),进行下载。


  输入:

       1、差异基因列表HTML文件(链接所有样品或分组之间的差异基因列表),由分析模块“Batch Mode: Retrieve Diff Genes list”生成。

  示例:

22.jpg


       2、全部基因列表文件,可由分析模块“Fetch all genes(row names) list from matrix”通过原始的FPKM矩阵或Count矩阵获得。

  示例:

BM590_A0001

BM590_A0002

BM590_A0003

BM590_A0004

BM590_A0005

BM590_A0006

BM590_A0007

BM590_A0008

BM590_A0009

……


       3、对应的KEGG注释信息文件,其中,第一列为基因名,第二列为对应的K号。Kddddd表示,在所有同源物种中具有相似结构和功能的一类同源蛋白。如K04456表示丝氨酸/苏氨酸蛋白激酶。

  示例:

BM590_A0001         K02313

BM590_A0003         K03629

BM590_A0005         K12972

BM590_A0006         K13896

BM590_A0007         K13895

……


  输出:

  差异基因KEGG富集分析结果HTML文件(链接所有KEGG富集分析的结果)。

  示例:

23.jpg



关于HTML链接的文件内容和格式。

*List文件参考分析模块“Batch Mode: Retrieve Diff Genes list”的帮助文档。

*.KEGG_enrich文件参考分析模块“KEGG Enrichment Analysis”的帮助文档。



分析模块引用了KOBASv2.0-20150126)软件(http://kobas.cbi.pku.edu.cn)。


  相关文献如下所示:

Xie, C., Mao, X., Huang, J., Ding, Y., Wu, J., Dong, S., Kong, L., Gao, G., Li, C. and Wei, L. (2011) KOBAS 2.0: a web server for annotation and identification of enriched pathways and diseases. Nucleic Acids Res, 39, W316-322.



KEGG (Kyoto encyclopedia of genes and genomes 数据库):京都基因和基因组百科全书,是系统分析基因功能、联系基因组信息和功能信息的知识库。利用KEGG数据库,可将基因按照参与的pathway通路或行使的功能分类。

!!更新KOBAS程序后台的KEGG数据库,通过KOBAS官网链接(http://kobas.cbi.pku.edu.cn/),下载最新的ko.db.gz文件,解压后覆盖软件根目录database文件夹下的同名文件。

分享