一文读懂WGCNA:从基因共表达网络到关键靶点挖掘

背景描述

图片

在复杂疾病的系统生物学研究中,高通量组学技术(如转录组、蛋白组、代谢组、翻译后修饰组等)正以前所未有的深度和广度揭示分子层面的异常。然而,面对海量、高维且异质的多组学数据,如何从中提炼具有生物学意义的功能模块,并精准识别关键驱动因子,仍是当前研究的核心挑战。

🔬

什么是WGCNA

加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)是一种强大的无监督系统生物学方法。

它通过计算基因/蛋白之间的表达相关性,将具有相似表达模式的分子聚类为功能协同的模块,并进一步分析这些模块与样本特征(如临床表型、治疗响应、生存状态等)之间的关联。

WGCNA有效搭建了“分子表达变化”与“宏观表型特征”之间的桥梁,是多组学整合分析与机制假说生成的核心工具之一。


图片
图片
图片


🚀

为什么选择WGCNA?



系统性整合修饰组数据

基于目标修饰位点数据矩阵,整合转录组、临床等表型数据,挖掘调控网络


精准定位表观靶点

基于模块-表型关联分析,识别与表观修饰异常显著相关的核心因子


多组学关联推断

一站式整合多组学特征 + 临床变量,从海量数据中提炼协同变化模块与关键靶点


可视化驱动决策

直观展示共表达模块、关键因子与表型之间的关系,助力靶点筛选与验证


图片
图片
图片


📊

WGCNA核心可视化内容


1

样本聚类与性状热图

直观展示样本间相似性与表型分布

图片


2

因子聚类与模块划分

将因子按表达模式聚类到不同功能模块

图片


3

特征因子网络

揭示哪些模块与特定表型(如疾病、治疗反应)高度相关

图片


4

模块-表型关系

关键因子筛选基于模块成员度(MM)和因子显著性(GS)精准定位核心靶点

图片


5

关键因子筛选(MM-GS双指标)

结合模块成员度(MM)(因子与模块关联强度)与因子显著性(GS)(因子与表型相关性),筛选高MM(>0.7)且高GS(>0.25)的核心靶点。

图片


图片
图片
图片


💡

从分析结果到关键发现


模块与表型关联分析是WGCNA的核心亮点!例如:

高甲基化模块与"肝癌分期"正相关(r=0.82, p<0.001)

图片


低甲基化模块与"化疗耐药性"负相关(r=-0.75, p<0.01)



通过MM-GS双指标筛选,精准定位修饰组驱动基因:

高MM值→模块内核心调控基因

图片


高GS值→与表型强关联的表观靶点


MM>0.7且GS>0.25的基因,即为修饰组调控的关键靶点!


🌐

WGCNA的终极价值

图片

WGCNA通过整合多组学数据,实现:

1

解析多组学协同调控机制

2

定位驱动表型的关键功能模块

3

赋能精准治疗靶点发现

4

破解组学数据整合瓶颈

分享