数据库| 拟南芥公共RNA-seq文库在线搜索平台发布

A Comprehensive Online Database for Exploring ∼20,000 Public Arabidopsis RNA-Seq Libraries12.084Mol Plant . 2020 Aug 5;S1674-2052(20)30257-4. doi: 10.1016/j.molp.2020.08.001. Online ahead of print.

2020年8月4日,南方科技大学生物系植物与食品研究所翟继先课题组在植物学领域知名学术期刊Molecular Plant 在线发表了可以方便快速查询超过两万个公共RNA-seq文库的在线资源,论文题为“A comprehensive online database for exploring ~20,000 public Arabidopsis RNA-Seq libraries ”

不得感叹,RNA-SEQ在数据库领域一直是多面手的存在,从未被超越。

对于物种数据库而言,基因组、转录组信息那是必不可少的单元。单独拎出来,RNA-SEQ数据那也是非常的能打,可以用于构建某个物种的表达数据库、内源调控网络数据库、RNA剪切数据库、RNA编辑数据库,数据用途广泛且意义重大。

用途如此广泛的宝贵资源,无论是构建什么类型的数据库,对于下游的基因实验、功能验证有着重要的指导意义。可以这么说,现阶段的科研活动离不开数据库的支撑,每一个重要或者不重要的物种,每一个研究领域和方向都这么一个数据库。

回到正题,来看一下这个新的在线搜索平台的应用。伴随着技术进步及测序成本的降低,RNA-seq已成为研究基因表达的黄金标准。截至目前,已经超过20,000个拟南芥相关的RNA-seq文库在公共数据库中发布。这些海量数据资源对研究基因的转录调控,组织特异性,胁迫处理以及不同发育阶段的基因表达是十分宝贵的资源。然而,如何高效地利用如此庞大的高通量测序数据资源,对于研究者来说是一个巨大的挑战,特别是对于缺少编程基础的实验人员或者计算资源短缺的研究团队。

网页数据集与功能说明
南方科技大学此次构建的Arabidopsis RNA-seq database( ARS)整合了来自GEO、SRA、ENA和DDBJ数据库的20,068个拟南芥RNA-seq数据,提供了一个在线的“Google-style”查询工具。该研究对所有文库进行了基因表达水平定量和共表达网络分析,并将所有文库进行分类,总共涉及1176个突变体,1102种处理条件,12个组织和176个发育时期,同时也对突变体和处理条件分别同对应的对照组进行差异表达分析。

基因表达量结果展示

此外,ARS支持并提供包含基因搜索,文库、项目编号、关键字以及任意不同组合的查询方式,同时兼具快速查找基因表达量、组织特异性、突变体和处理响应的功能。用户可根据自己的需求在搜索前和搜索后对表格结果进行过滤,获取相应文库的信息。此外,网站部署了online基因组浏览器(IGV),实验人员可更加便捷的查看每个文库的详细比对情况。为便于研究者之间快捷地分享最新搜索结果,ARS提供了网页共享功能,并定期更新文库资源,研究者可通过共享按钮来共享当前结果。

IGV查看序列比对情况


分享