​学会了这个数据库,还愁发文章申基金?

上面我们给大家介绍了miRNA的SNP临床研究套路、基础研究套路。不知大家是否领悟到了核心思想,有没有想要挖掘一下,来小试牛刀呢?不过还是想要提醒大家,相比于学习数据库的使用,把前面的几篇文章好好读一读,理解清楚思路才是更重要的事情。


今天给大家推荐一个数据库工具,帮助大家挖掘这个方向!这个数据库就是华中科技大学郭安源教授课题组开发的miRNA SNP V3(我们在之前介绍过他们的GSCALite数据库,非常好用!),网址为:
http://bioinfo.life.hust.edu.cn/miRNASNP/#!/


下面来给大家简单介绍一下网站的使用:


在主页,我们可以看到一个综合性搜索框,可以直接搜索miRNA或者基因或者SNP的名字(没错,三合一!)。


我们先以hsa-miR-10b-5p为例进行搜索,可以看到如下的界面这里介绍了miRNA的相关信息,浅蓝色的字体可以点击,然后会跳转到相关网站详细展示这部分的信息。


“Variation in miRNA”部分则介绍了在miRNA种子区域的SNP数目,成熟miRNA的SNP数目,在种子区域中与疾病相关的SNP数目(DRV)以及在成熟miRNA中,与疾病相关的SNP数目。



然后也展示了hsa-miR-10b-5p在各种肿瘤中的表达量,以及在CCLE和NCI60细胞系数据库中,药物敏感性与miRNA表达量的相关性,并显示了最为显著地几个药物。



在另外两栏中“Target gain with SNP in seed”和“Target loss with SNPs in seed”这两栏分别表示在miRNA上发生这个SNP变异会获得哪些靶基因(原本不靶向,发生SNP后反而能靶向了)或者会失去靶向哪些基因的能力(原本靶向,发生SNP后不能靶向了)。


注意的是“Exp.cor”这一栏表示miRNA和基因间的表达相关系数,“?”表示miRNA与基因间是否经过了实验验证。“Predict”栏,可以点击进去查看预测结果的详细信息。


如果大家对之前文章里讲的内容比较熟悉的话,应该就会想到这一部分蕴含了很多宝藏啊。miRNA发生SNP会影响结合的靶基因,进而影响下游的功能变化,这个都可以挖掘出文章啊啊啊啊!



“Target genes Enrichment Analysis”部分应该不难理解,就是miRNA的靶基因所富集的通路。分KEGG和GO两部分。既有表格展示,也有大家喜爱的图形化展示。



如果大家在开头用基因进行搜索,那么会先跳转出如下界面:


左边的表示这个基因的SNP信息,右边会展示与疾病相关的SNP



首先看第一个,SNP。


点击进去后会看到如下界面,有两点解释一下:


1. SNP GMAF表示SNP Global Minor Allele Frequency(全局次要等位基因频率),就是SNP变异型发生的频率;
2. “SNP in GWAS LD Region”这个选项表示SNP是否发生在SNP连锁不平衡区域(Linkage disequilibrium Region)。


下面的表格中,“Gain”表示发生这个SNP变异使得3’UTR区域获得/增添的可靶向该区域的miRNA数目,“Loss”则相反,点击进去可以查看相关的信息。




ClinVar部分的内容则相对偏与临床相关一些。大家可以在Tissue中选择大家自己关注的组织,在Disease中选择自己关注的疾病,在Source中选择不同的数据库:COSMIC/ClinVar/GWAS。



讲到这里,其实也就讲完了网页上头显示的“SNP”和“Disease”部分,因为他们的功能都是相互串连在一起的。


Predict部分,网页提供了三个功能,分别是预测发生在基因3’UTR区域、成熟的miRNA上和miRNA前体上所产生的影响。Download部分则提供了数据下载,网页对数据进行了分类,大家如果有一定的数据清洗能力的话,比如用R语言进行清洗,那么可以下载数据,自己再进行筛选。
分享