Systematic comparison of Highthroughput Single-cell and Singlenucleus transcriptomes during Cardiomyocyte Differentiation4.011Sci Rep . 2020 Jan 30;10(1):1535. doi: 10.1038/s41598-020-58327-6.
Abstract
A comprehensive reference map of all cell types in the human body is necessary for improving our understanding of fundamental biological processes and in diagnosing and treating disease. High-throughput single-cell RNA sequencing techniques have emerged as powerful tools to identify and characterize cell types in complex and heterogeneous tissues. However, extracting intact cells from tissues and organs is often technically challenging or impossible, for example in heart or brain tissue. Single-nucleus RNA sequencing provides an alternative way to obtain transcriptome profiles of such tissues. To systematically assess the differences between high-throughput single-cell and single-nuclei RNA-seq approaches, we compared Drop-seq and DroNc-seq, two microfluidic-based 3' RNA capture technologies that profile total cellular and nuclear RNA, respectively, during a time course experiment of human induced pluripotent stem cells (iPSCs) differentiating into cardiomyocytes. Clustering of time-series transcriptomes from Drop-seq and DroNc-seq revealed six distinct cell types, five of which were found in both techniques. Furthermore, single-cell trajectories reconstructed from both techniques reproduced expected differentiation dynamics. We then applied DroNc-seq to postmortem heart tissue to test its performance on heterogeneous human tissue samples. Our data confirm that DroNc-seq yields similar results to Drop-seq on matched samples and can be successfully used to generate reference maps for the human cell atlas.
前言
一个全面的人体全类型细胞的参考图对于提高人们对基础生物过程的认识、疾病诊断及疾病治疗非常必要。高通量单细胞测序技术已经被广泛应用于识别和鉴定组织中各个细胞类型。然而从组织和器官中分离完整的细胞是一项相当有挑战性的工作,例如心脏或脑组织就是相对难解离的组织。而利用单细胞核进行测序则有望解决此问题。
为了系统分析高通量单细胞测序和单细胞核测序的差异,科学家比较了Drop-seq(单细胞测序)和DroNc-seq(单细胞核测序)的数据,这两种技术都是基于微流控的3’末端RNA捕获测序技术(原理与10X相同),数据展示了在诱导人类多能干细胞(iPSCs)分化为心肌细胞(CM)的过程中所有细胞和细胞核的转录组图谱。对Drop-seq和DroNc-seq技术获得的几个时间点的转录组数据进行聚类,得到了六种细胞类型,其中的五种为两种技术所共有的。另外,由这两种技术所重建的单细胞发育轨迹再现了预期的分化动力学。然后,将DroNc-seq技术用于成年男性死后冷冻的心脏组织以检测该技术在异质性人体组织样本的性能,结果显示DroNc-seq对匹配样本产生了与Drop-seq相似的结果,并且可以成功用于绘制人类细胞图谱的参考图。
那么,Drop-seq和DroNc-seq所获得的数据都有什么特点?
材料与方法
1) 材料:
iPSCs:多能干细胞
成人冷冻心脏组织
2) 方法:
Drop-seq(单细胞转录组测序)
DroNc-seq(单细胞核转录组测序)
实验设计
取iPSCs分化成心肌细胞的不同时间点的样本,分别使用Drop-seq和DroNc-seq进行取样建库测序。时间点选择0天、1天、3天、7天和15天5个时间点(Fig.1A)。
实验结果
1)与DroNc-seq相比,Drop-seq 检测到了更多的基因数量和转录本,这显示完整细胞中转录本的丰度高于细胞核,其中Drop-seq检测到每个细胞中的平均基因数为962个,每个细胞中平均UMI数量为1474,而DroNc-seq检测到每个细胞核中的平均基因数是553,每个细胞核的平均UMI数为721,均低于Drop-seq的检测数量(Fig.1B)。Drop-seq检测到的细胞总数为25,475,高于DroNc-seq检测到的细胞总数的17,229;在过滤后的数据中,每个取样时间点两组细胞系都能被检测到(Fig.1C)。
在原始测序数据中发现,Drop-seq检测到的高表达基因为线粒体基因和核糖体基因,而DroNc-seq检测到的高表达基因为非编码RNA MALAT1(Fig.1D)。比较两种方案中检测到的基因发现,273个仅在DroNc-seq中能够检测到。在这273个基因中,107个(39%)是长链非编码RNA,这证实了DroNc-seq更容易检测到强核定位的转录物。
2)DroNc-seq的内含子读取比例明显高于Drop-seq,在DroNc-seq中50%的reads比对到内含子区,而Drop-seq中有7% 的reads比对上内含子(Fig. 2A)。利用比对到内含子上的reads序列进行基因定量已有报道,事实上使用包含内含子的reads对基因表达进行定量可以使DroNc-seq数据的基因检出平均提高1.5倍(Fig 2B)。这种检出率的增加导致一些之前无法检出的基因可成功被检出,例如中胚层及心脏的某些基因(Fig. 2C)。这些数据说明内含子序列可用于补偿与完整细胞相比缺少的那部分核RNA。
基于上述原因,我们将内含子序列列入分析,提高了DroNc-seq的基因检出率。加入内含子后,检出的核为25429个,另外,每个细胞的平均UMI数从721增加到918,平均基因数从553增加到672。对两种技术在基因检测的特异性方面进行比较发现,两种技术之间的差异表达基因比不同时间点或不同细胞系之间的差异表达基因要多(Fig 2D)。尤为明显的是DroNc-seq中检测到5%的高表达基因是LncRNA(Drop-seq 中是1%),而Drop-seq中检测到的分别高表达分别是线粒体基因(20%)和核糖体基因(6%)(Fig. 2E)。
Figure 2
3)通过对数据进行聚类分析,发现Drop-seq和DroNC-seq均能反应从iPSCs到CMs的7天中的预期差异(Fig. 3A, 3B)。其中,iPSCs为0天和1天的样本(橙色);3天的样本主要形成了心脏祖细胞(绿色),而在在第7天和第15天,Drop-seq和DroNc-seq所捕获的细胞簇显示出轻微的差异,在Drop-seq中检测到4个细胞簇,而DroNc-seq只有3个簇,这表明Drop-seq可能检测敏感度更高。Drop-seq显示了一个额外的较小的簇(紫色,“另类谱系2”,FLT1的表达),在DroNc-seq中没有找到相应的细胞群。这些“另类谱系”簇可能代表处于中间阶段、分化失败或向另类谱系分化的细胞。该结果显示Drop-seq和DroNc-seq都能识别群体中的主要细胞类型。重要的是,在这两种技术中,所鉴定得到的细胞簇显示了相似的基因表达模式,这表明,尽管这两种技术优先检测的特定基因子集不同,但主要细胞类型的鉴定基本上没有受到影响(Fig. 3C 3D)。
将单细胞数据整合成一个拟bulk测序的数据与之前已发表的bulk测序数据进行比较发现,首先,Drop-seq的效果优于DroNc-seq的结果;另外,两种方法的iPSCs拟bulk样本与iPSCs相关性最好,其次是iPSCs心肌细胞和原发性心脏组织。对于CMs拟bulk样本,两种方法与iPSC-CMs的相关性最好,其次是原始心脏组织和iPSCs(Fig. 3E)。两种测序技术均显示不止一个时间点包含多个细胞类型(Fig 3F 3G)。利用Monocle20从DroNc-seq和Drop-seq数据重建细胞的分化轨迹显示只有一个分支点。按细胞类型(Fig. 3H,3I)和拟时序给细胞着色确认了图3F,G中细胞类型的时间顺序。Monocle20将iPSCs放置在轨迹的开始处,轨迹的拟时序为零,然后是心脏祖细胞。两种方法均提示iPSCs分化为一种中间细胞类型(心脏祖细胞),最后根据TNNT2和MYH6的表达,分化为一个明显可识别的心肌细胞群。由于成人心脏组织不能用于产生Drop-seq数据,但是可用于产生DroNc-seq数据,将两种数据进行比较后发现DroNc-seq提供的数据与Drop-seq相似的,因此将DroNc-seq应用于冷冻的人心脏组织,以识别组织中可能的心脏细胞亚型和非心脏细胞。
4)利用DroNc-seq技术捕获到成年男性的心脏组织中4796个细胞核,每个细胞的平均基因数是361,UMI是823。聚类分析显示大部分细胞(约82%)是CMs(Fig. 4A,粉红色)和肌成纤维细胞 (Fig. 4A,绿色)。Figure 4B显示的是使用负二项似然比检验获得的每种细胞类型的marker基因。另两种基因簇是内皮细胞(Fig. 4A 灰色)和其他类型细胞(Fig. 4A 黑色)。为了更好的理解原始心脏组织的细胞类型组成,整合了单细胞核的测序数据作为一个拟bulk的心脏组织测序的结果,并将此数据与bulk iPSCs转录组数据和iPSC-CMs转录组数据相比较,结果发现拟bulk心脏组织的测序数据与原始心脏组织进行转录组测序所得的数据相关性最高。其次是iPSCs-CMs (Fig. 4C)。为了将心脏细胞核数据与体外模型进行比较,我们使用相关分析将iPSC-CMs上的心脏单个核与DroNc-seq进行了比较。Fig. 4D显示与肌成纤维细胞和内皮细胞(Fig. 4A,深绿色和灰色簇)相比,识别为CMs的簇(Fig. 4A,粉红色簇)与iPSC的CMs具有更强的相关性。
Figure 4
结论
从上述实验可以看出,使用完整细胞或细胞核进行测序,虽然所得到的高表达基因有所不同,两种技术也各有敏感性,但是在鉴定细胞类型上,两种技术所产生的结果差异并不大,这对无法用完整细胞开展单细胞转录组研究的科研人员提供了很好的数据支撑。