零实验揭示类风湿性关节炎(RA)lncRNA功能

目前关于mRNA和miRNA的研究数不胜数,继而逐渐发现长链非编码RNA(lncRNA)在各种生物过程中也起着重要的作用,lncRNA成功吸引到科研大佬们的关注,但目前lncRNA功能注释的研究甚少,怎样分析lncRNA的功能呢?


今天就借助Jiang等2017年的一篇文献[1]和大家分享一种lncRNA的研究套路——通过构建lncRNA-miRNA-mRNA网络来揭示lncRNA的功能,零实验、纯生信分析哦。


划重点:零实验!


1.jpg


依据ceRNA理论,研究lncRNA与miRNA和mRNA在功能上的联系,来揭示类风湿性关节炎(RA)中lncRNA功能。


首先,我们来看研究思路




(1)初始数据集;

(2)差异表达分析;

(3)基于miRNA预测靶向lncRNA和mRNA;

(4)构建lncRNA-miRNA-mRNA网络,并进行相关功能富集分析;

(5)关键lncRNA及功能分析。


2.jpg

lncRNA–miRNA–mRNA network构建流程图


是不是很简单~

接下来就详解怎样完成这四步咯


(1)初始数据集

miRNA数据:①从GEO数据库挑选两组数据:GSE71601、GSE37425,筛选出22个共表达miRNA(共表达miRNA:有相同的子序列、且表达趋势一致的miRNA);②miRNA-17, miRNA-20, miRNA-124和miRNA-152,这四个已知对RA具有重要调控作用的miRNA也被纳入后续分析。


lncRNA和miRNA数据:引用Jiang等2016年文献中[2],关节炎小鼠滑膜组织中差异表达的260lncRNAs和675 mRNAs。


(2)差异表达分析

对初选出来的lncRNA、miRNA和mRNA进一步筛选,t-test,设定P-values<0.05, fold change>2,筛选得到差异表达miRNA(DEMis)、mRNA(DEMs)和lncRNA(DELs) 的数量分别为24、242和68。


(3)基于miRNA预测靶向lncRNA和mRNA

以24个DEMis为中心预测靶向lncRNA和mRNA

7个靶向lncRNA:用RNAhybrid program对miRNA–lncRNA进行预测,方法细节见下图

3.jpg



90个靶向mRNAmiranda targetscan数据库下载miRNA–mRNA互作关系


(4)构建lncRNA-miRNA-mRNA网络,功能富集分析

基于ceRNA理论,构建lncRNA–miRNA–mRNAnetwork,方法如下:

共表达lncRNA–mRNA pair:DELs和DEMs表达相关性分析:PCC > 0.99, P < 0.05;


lncRNA-miRNA–mRNAtriplet:lncRNA–mRNA pair中lncRNA和mRNA都是某一miRNA的靶向基因,且与该miRNA呈表达负相关,符合该条件的构建为miRNA–mRNA–lncRNAtriplet。


Cytoscape软件将所有miRNA–mRNA–lncRNA triplet网络联系并可视化,计算节点度。


这样就成功构建lncRNA-miRNA-mRNA网络。


4.jpg


功能富集分析:利用Cytoscape plug-in BinGO and Database,对网络中的mRNA进行GO功能分析和pathway分析;得到147条生物过程相关GO terms及互作关系(下图)。


5.jpg


设定:P-value<0.05和Benjamini   P-value<0.05,筛选出84条显著富集的GOterms和23条pathway,前10条GO terms和pathway分别如图A和图B所示。


6.jpg


(5)关键lncRNA及功能

为了找出关键lncRNA,进行如下筛选过程:

枢纽节点:计算lncRNA–miRNA–mRNA网络中所有节点的节点度,筛选出30个枢纽节点(节点度≥5),包含7lncRNAs, 13miRNAs和10mRNAs(见下表)


7.jpg


关键lncRNA:计算lncRNA有关的miRNA和mRNA数量,结果如下表所示。排列靠前的3个lncRNA:S5645.1, XR_006437.1, J01878,具有较高的节点度、及miRNA和mRNA数量,可以作为关键lncRNA。

8.jpg


关键lncRNA的功能分析Cytoscape提取关键lncRNA相关的miRNA和mRNA构建亚网络结构,并进行功能富集分析,下图是3个关键lncRNA的亚网络及功能分析结果。


9.jpg

10.jpg

lncRNA S5645.1

11.jpg

12.jpg

lncRNA XR_006437.1


13.jpg

14.jpg

lncRNA J01878


最后根据这些lncRNA的功能富集预测其功能,例如lncRNAS5645.1的GO和pathway分析结果显示与RA高度相关,推测:s5645.1 lncRNA可能与一些miRNA家族存在竞争作用,如miR-152和miR-20家族,影响RA疾病相关的下游基因表达。


思维延伸:一篇没有任何实验的文章(IF=2.781)就这样发出来了。该文章在原始数据选用上还是存在较大缺陷的,同一类型数据来源物种不一致——miRNA数据来源于不同物种(人和小鼠),动物模型数据分析人类疾病——lncRNA和mRNA数据也是来自小鼠,这些数据引用合理性存在较大异议,故我们在挖掘数据时应合理筛选数据,如数据类型、物种来源、组织来源、样本量大小等,准确筛选原始数据是生信分析的基础。


但文章的研究套路还是可以借鉴哒——通过构建lncRNA-miRNA-mRNA网络来揭示lncRNA,从不同方向拓展继续挖掘数据发文章,如:分析其他疾病的的lncRNA功能,在不同数据库(TCGA)挖掘数据,starBase、CRN、Firebrowse等也可用于lncRNA-miRNA-mRNA网络构建等。也就是已知故事框架,不同方式补充不同内容就可以讲不同故事!


希望能帮助到大家更好地利用生信资源,少做实验多发文章!!!

1.Jiang, H., et al., Reconstruction and analysis of thelncRNA-miRNA-mRNA network based on competitive endogenous RNA reveal functionallncRNAs in rheumatoid arthritis. Molecular Biosystems, 2017. 13(6).


2.Jiang, H., et al., LncRNAs expression in adjuvant-inducedarthritis rats reveals the potential role of LncRNAs contributing to rheumatoidarthritis pathogenesis. Gene, 2016. 593(1):p. 131-42.

分享