单细胞分析的相关数据库教程

单细胞数据库SCPortalen、scRNASeqDB收录了单细胞测序结果的专业数据库,两个数据库的主要用法是告诉大家有哪些单细胞测序的结果已经完成了,我们可以下载后自己分析。其中scRNASeqDB主要收录的是来自GEO的生物医学单细胞测序数据。

CellMarker:CellMarkers可以查看不同细胞群体的marker基因,或者输入一个基因,数据库就可以告诉我们该基因属于哪种组织、哪种细胞。

ArrayExpress:这个数据库的优势在于能够做简单数据挖掘,有专门的单细胞测序板块、方便用户使用有整理好的数据供下载分析挖掘,免费开放。

1. SCPortalen: human and mouse single-cell centric database.

1.webp.jpg


网址:http://single-cell.clst.riken.jp

SCPortalen收录的信息包括了单细胞的图片、数据和序列,可以按照细胞和数据集(dataset)进行搜索:

2.webp.jpg

我们以dataset为例说明,选择上图中的Transcriptomics dataset选项,这是打开的界面:

3.webp.jpg

我们以第一个数据集为例看一下有哪些信息:

4.jpg

首先我们可以通过dataset title和article abstract了解这个数据集的基本信息:

111.webp.jpg

5.webp.jpg


Data repository是这个数据的保存地址:

6.webp.jpg

还可以下载PCA,t-SNE图和结果:

7.webp.jpg

8.webp.jpg



以及搜索某个基因表达的FPKM值:

222.jpg

10.webp.jpg



参考文献:SCPortalen: human and mouse single-cell centric database.Nucleic Acids Res. 2018 Jan 4;46(D1):D781-D787.


2.scRNASeqDB: A Database for RNA-Seq Based Gene Expression Profiles in Human Single Cells.

11.webp.jpg

网址:https://bioinfo.uth.edu/scrnaseqdb/

这个数据库收录了38个单细胞转录组的数据集和13440个样本的信息,其中GEO数据库中的数据集有36个,我们可以根据基因或者细胞进行搜索:

12.webp.jpg

下面我们先根据基因名字进行搜索,就以数据库给出的TBK1这个基因为例:

13.webp.jpg

首先给出的是TBK1基因在不同数据集中的表达(Gene Rank View),我们换成Gene List View:

14.webp.jpg

这样我们就可以看到每个TBK1在不同数据集中的情况了,我们可以看到一个胶质瘤的数据:

15.webp.jpg

数据集是GSE57872:

16.webp.jpg


这是2014年发表在Science杂志上的文章的原始数据:

17.webp.jpg

单击TBK1下面的Gene View打开界面:

18.webp.jpg

333.webp.jpg

下面还有与TBK1表达最相关的100个基因的功能注释:

19.webp.jpg



20.webp.jpg

21.webp.jpg

22.webp.jpg

23.webp.jpg

如果用细胞进行搜索也是可以的,比如以liver为关键词:

25.webp.jpg


展示的是2016年一篇研究肝癌的文章数据:

26.webp.jpg

27.webp.jpg

28.webp.jpg


3.CellMarker

CellMarker于在2019年1月份发表于核酸研究 (Nucleic Acids Research),由哈尔滨医科大学Yun Xiao等老师发表,数据库收录了158种组织/亚组织的467种人细胞类型, 81种组织/亚组织的389种鼠细胞类型。数据主要来源于文献和数据库,包括单细胞测序数据和生物实验数据。CellMarker主页如下:

                         

a.webp.jpg

                   


通过主页右上角Quich Search 对话框,可以输入细胞类型、细胞marker或者组织,点击搜索之后就会看到特定细胞类型的所有marker信息(方法1);或者直接点击图片中不同组织中的细胞名称,进入该特定组织、特定细胞类型的marker信息(方法2).二者的唯一区别是,方法1展示的是所有组织类型中特定细胞的marker信息,方法2展示的是特定组织、特定细胞的marker信息。

     

b.webp.jpg

                                     

进入的结果页面如下,以三张图进行展示:

1

Cell search展示了方法2的搜索结果,展示了特定组织、特定细胞,同时可以在下面的伸缩框中选择组织、细胞进行重新搜索;

c.webp.jpg

2

Statistical graph of cell markers展示了特定组织、特定细胞的marker的统计信息及支持材料的数量。

d.webp.jpg

3

Result展示了特定组织、特定细胞的marker信息。

e.webp.jpg

点击最后一列“more details”超链接(上图),可以看到更加详细的信息,包括该marker的文章来源、研究类型等信息(下图)。

f.webp.jpg

通过点击主页中Browse按钮,可以看到在每个组织中cell marker的数量,另外还可以看到左边四种分类方式:Human、Mouse、Cell和Single-cell RNA sequencing

g.webp.jpg

点击左侧Human,可以看到不同的组织、不同细胞类型的信息,如果点击Kidney的Cancer stem cell,会出现肾脏肿瘤干细胞的Cell Markers。在Source这一栏,共有4种信息来源,点击Excel或者CSV可以下载该列表。

h.webp.jpg

在“Marker search”中输入CD45, Submit之后会看到CD45在脂肪组织和骨髓的间充质干细胞(mesenchymal stem cell)和脂肪组织的脂肪干细胞(Adipose-derived stem cell)特异表达。


i.webp.jpg

j.webp.jpg


4.ArrayExpress

https://www.ebi.ac.uk/arrayexpress/

ArrayExpress数据库中最新上线了关于单细胞数据挖掘的网页工具名为 Single Cell Expression Atlashttps://www.ebi.ac.uk/gxa/sc/release-notes.html.,大概看下它的内容,最近的更新包含了52study,数万个细胞的测序结果。


3.webp.jpg

数据挖掘功能

按数据集进行挖掘,可视化,可以选择自己感兴趣的数据集,物种等,获取基本信息

4.webp.jpg

我们来看一个黑色素瘤的单细测序结果:

5.webp.jpg

进行可视化查看分析结果,比如tSNE的聚类结果:

6.webp.jpg

marker基因的表达热图:

7.webp.jpg

还可以看实验设计的基本信息:

8.webp.jpg

关于单细胞测序的一些分析方法,作为补充信息:

111.webp.jpg

还可以自己去下载这些数据进行分析,挖掘:

10.webp.jpg


分享