1、前言
2、10X空间转录组原理和步骤
3、空间转录组相关文献简述
1、前言
单细胞测序技术作为当下最火的技术之一,目前在组织细胞图谱、癌症发生、免疫微环境、干细胞分化、器官发育、心脑血管疾病等领域的研究成果非常多,几乎每天都会有相关文章发表,可谓如火如荼。
继2018年单细胞测序(single-cell sequencing)被Nature Methods评为年度技术后,在2019年,单细胞多组学(single-cell multimodal omics)被评为年度技术。单细胞多组学研究,除了应用最多的基因表达(expression,单细胞转录组RNA)外,还包括遗传(genetic,单细胞CNV)、表观遗传(epigenetic,单细胞DNA甲基化、单细胞ATAC)、空间(spatial)、蛋白质组(proteomic)和谱系(lineage)等各个方面,单细胞多组学联合分析,能够帮助我们更深入的揭示各种生物学问题。目前除了单细胞DNA甲基化外,其他单细胞技术都可以通过商业化的平台比如10XGenomics来完成。
大家对单细胞转录组测序都比较了解,目前关注最多的则是最新的空间转录组(Spatial Transcriptomics,ST)。实际上ST已不是新名词,2016年Joakim Lundeberg的Spatial Transcriptomics技术在Science上发表,2017年景乃禾lab的GEO-seq技术在Nature Protocols上发表。目前已发表的ST的研究方法非常多,包括10X的ST、Slide-seq、GEO-seq、HDST等等,如下图。
在国内,上海中科院景乃禾研究员等开发的GEO-seq(geographical position sequencing)测序,主要是基于显微切割和单细胞微量扩增(LCM+SmartSeq)的方式,类似于北大汤富酬教授的显微挑选+SmartSeq单细胞测序的方式,跟10X平台相比,工作量相对较大,操作相对麻烦些。
在国外,瑞典皇家理工学院的Joakim Lundeberg,基于芯片和空间条形码技术发明了高通量的空间转录组测序方法,创建了Spatial Transcriptomics公司,顺便发了一大堆ST的文章(包括Cell、Science和多篇Nature子刊),名利双收实乃人生赢家。2018年将公司卖给10XGenomics后,接着又开发了一个基于微孔和beads技术的通量更高、分辨率也更高(但更复杂)的高精度空间转录组学HDST(high-definition spatial transcriptomics)技术,据称通量可以达到289万个beads、超140万个孔,分辨率可以达到2μm,发表在2019年的Nature Methods上。
在HDST中,作者将磁珠连接到空间条形码化的寡核苷酸上,形成的独特的组合磁珠。阵列中还有多个2μm的小孔组成的六边形矩阵,将每个组合磁珠以随机排列的方式分别放入到2μm的小孔中,由此制造出磁珠阵列。然后通过顺序杂交和纠错策略解码每个磁珠的位置。将组织进行冷冻切片后,把组织放在解码的磁珠阵列上,进行H&E染色和成像后,就可捕获RNA,结合RNA-seq进行分析,实现了高精度无间隙的空间组学分析。如下图。
BROAD研究所的Evan Z. Macosko和Fei Chen(需要指出的是Macosko和Fei Chen分别是Drop-seq和Expansion Microscopy的主要发明人)也在Science上介绍了基于芯片和beads的Slide-seq技术,该技术核心是把类似Drop-seq用的小球(直径10μm左右,每个小球有特定的序列标签和oligo dT用于捕获RNA)固定在橡胶覆盖的玻璃板上。接下来,贴合冰冻组织切片,解冻切片,捕获从切片中游离出来的RNA,之后逆转录,加上测序标签进行测序。也可以做到上百万个beads,技术跟HDST类似,都用了beads,但beads不是落在微孔中,而是固定在芯片上。如下图。
其他还包括耶鲁大学樊荣(Rong Fan)课题组在bioRxiv发表的,创新性地开发了一套基于微流控的空间条形码编码实验方案DBiT-seq(microfluidic Deterministic Barcoding in Tissue for spatial omics sequencing),缺点是通量不高,优点是可同时检测固定的组织切片的转录组、蛋白组以及其他组学。
以上方法各有优势,其他方法也不再赘述。目前使用得最广泛、也最成熟的就只有商业化的10XGenomics的spatial transcriptomics技术,经过优化、更新后改名为Visium Spatial Gene Expression Solution。下面就对此技术做简单介绍。
2、10X Visium Spatial空间转录组原理和步骤
2.1 为什么要做ST
在生物体的器官和组织中,细胞类型的组成、细胞之间的相对位置、以及细胞群体的基因表达水平,共同决定组织是否能行使其正常功能状态。单细胞RNA测序(scRNA-seq)能够系统地、大规模地鉴定组织中的各种细胞群体的组成,以及基因的表达情况,能够解决细胞异质性的问题,可以找到疾病中起关键作用的细胞群体,但是却无法确定细胞的空间分布位置,从而丢失细胞的位置信息。原位杂交FISH能同时检测少数几个基因的表达分布情况,但很难实现高通量检测。
ST能够很好的解决单细胞测序无法解决的细胞空间分布的问题。不同于scRNA-seq,ST是直接利用组织冰冻切片、高通量的原位检测组织切片中不同区域的RNA的表达模式以及空间分布。换句话说,ST能够将基因的表达情况 与感兴趣的组织切片的免疫化学染色图像进行整合,从而将组织内不同细胞的基因表达信息定位到组织的原始空间位置上去,从而直接观测组织中不同部位功能区基因表达的差异。将scRNA-seq和ST这两种当下最热门最先进的技术同时应用,可以很好的揭示组织中的细胞图谱的空间组成、细胞类群的异质性分布、以及基因在不同位置间的表达差异,获得复杂而完整的基因的时间和空间表达图谱,在癌症、免疫、发育等研究领域具有非常重要的研究价值。
2.2 ST的原理和流程
ST分TO(Tissue Optimization)Slide优化芯片和LP(Library Preparation)Slide文库芯片。
每张TO优化芯片具有8个array区域,用于做组织切片样本的目标区域优化和透化条件优化。每张LP文库芯片具有4个array,用于做正式切片的RNA捕获和建库测序,每个array含有5000个spots,每个spot均含唯一的带位置信息的空间条形码spatial barcode和上百万个寡核苷酸探针。对组织切片进行透化后,细胞释放的mRNA可与带有barcode的探针结合,后续逆转录合成cDNA并进行文库构建和测序。依据组织类型和细胞大小不同,每个barcode可能覆盖1~10个细胞。最后,根据测序数据的barcode条形码信息对数据进行分析,以确定哪些数据来自哪个位置,从而实现空间基因表达的可视化。
A、切片制备和优化:取新鲜组织、冷冻、切片,并进行HE染色成像,优化确定切片是否覆盖靶向区域。
B、切片固定和透化:将组织切片放置在含有与RNA结合捕获探针的载玻片上,并进行固定和透化,使细胞中的 mRNA 得到释放,并结合到相应的捕获探针上,从而获取基因表达信息。
C、逆转和文库构建:以捕获的 RNA 为模板,进行 cDNA 合成,和测序文库制备。
D、高通量上机测序:对制备好的测序文库,进行二代高通量短读长测序。
E、数据可视化分析:结合HE结果,确定哪些基因有表达,表达量高低,以及这些基因的空间位置信息。
也可以观看10x官方视频介绍:
2.3 ST实验步骤
详细步骤下载链接:https://support.10xgenomics.com/spatial-gene-expression/sample-prep/doc/demonstrated-protocol-visium-spatial-protocols-tissue-preparation-guide
技术支持文档:https://support.10xgenomics.com/spatial-gene-expression
2.4 ST分析结果展示
ST生成的数据,可以允许研究人员选择任何感兴趣的一个或几个基因,进行组织原位聚类,展示基因在不同位置、不同区域的表达丰度,在原始组织切片上显示器空间解析的表达情况。结合单细胞转录组的marker基因数据以及组织形态学,可以将细胞和基因共定位,将组织区域划分为不同的细胞类型。
另外,目前10X官方已做过优化的样本类型如下:
3、空间转录组部分文献简述
目前空间转录组的文献还非常少,10X官网发布的才14篇,算上其他方法发表的,全部加起来也才几十篇。大家自己去读原文也是很快的。在此仅挑一部分,简单介绍方法和思路,供大家参考。
-----------------------------------(1)----------------------------------------
英文题目:Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas
中文题目:用空间转录组和单细胞测序描述胰腺导管癌的组织结构
发表期刊:Nature Biotech
影响因子:31.864
发表时间:2020.01.13
Ø 摘要:
单细胞RNA测序(scRNA-seq)能够系统地鉴定组织中的细胞群体,但刻画它们的空间组织分布仍然具有挑战性。我们将一种基于微阵列的空间转录组方法(该方法使用一系列斑点来揭示基因表达的空间模式,每个斑点捕捉多个相邻细胞的转录本)和scRNA-Seq结合从而对同一样本进行研究。为了诠释不同组织区域的精确细胞组成,我们引入了一种多模态交集分析方法MIA(multimodal intersection analysis)。将MIA分析应用于原发性胰腺肿瘤PDAC,我们发现导管细胞、巨噬细胞、树突状细胞和癌细胞亚群在空间上具有限制性富集,并与其他类型的细胞有截然不同的共富集。此外,我们还发现表达应激反应基因模块的癌细胞与炎性成纤维细胞具有共定位。 我们用scRNA-seq绘制细胞亚群结构的这个方法可以用来揭示复杂组织内部的相互作用。
Ø 材料与方法:
①ST:2个主要样本(PDAC-A、PDAC-B,各3张切片),4个额外样本(PDAC-D/E/F/G,各1张切片),6个样本共10张切片、共做10个ST array
②scRNA-seq:3个样(PDAC-A、PDAC-B、PDAC-C),采用indrop-seq而非10XGenomics
③Immunofluorescence免疫荧光双染共定位验证
④ MIA数据分析、TCGA高级分析
Ø 实验流程图:
Ø 实验结果
scRNA-seq鉴定A和B两个肿瘤组织样本中分别存在15和11个细胞类群。ST测序跟H&E对比分析,发现ST结果中的空间基因表达与组织学结果较为匹配。每个ST成像点会捕捉到20-70个细胞、检测到约1000个基因表达。每个组织的ST分析检测到大约2400个UMIs。
多模式交集分析(Multimodal intersection analysis,MIA)通过计算专门映射到该区域的基因与通过scRNA-seq数据鉴定的细胞类型marker基因之间的重叠程度,来推断特定组织区域中特定细胞类型的富集。
应用MIA分析,绘制出不同细胞类型和亚群在肿瘤微环境中的位置,以及癌症亚区内细胞类型之间的关系。例如PDAC-A的成纤维细胞marker基因与ST分析结果中的特定区域的一组基因显著重叠。还发现导管上皮区域富含导管细胞,而胰腺组织则富含腺泡细胞和分泌细胞。
通过10个ST样本的MIA图,还发现应激反应癌细胞状态与炎性成纤维细胞共存的证据。通过对TCGA数据的分析和免疫荧光实验,进一步支持这个发现。
Ø 结语
尽管ST的分辨率还不能确定单个ST点中特定细胞类型的富集,但结合scRNA测序对细胞类型和细胞状态的识别能力,MIA分析提供的独特视角,可以帮助基于空间定位(相对于组织或存在的其他细胞类型)为所识别的细胞状态和亚群分配潜在的功能角色。对于不同肿瘤亚类的精确组成可能因个体不同而不同的肿瘤,可以确定特定患者的亚群组成和空间定位,并且在未来可能具有预后价值。
此项技术的开发将两种互补且强大的技术相结合,可以轻松扩展到任何结构复杂的组织,也具有多个领域的生物学应用价值。在临床应用方面MIA为精准分类,个性治疗提供了更深层次的支持依据。
Ø 其他
关于生物学重复:根据Fig.1、2、3,对PDAC-A、PDAC-B两个癌样本的单细胞图谱聚类t-SNE分析,以及ST细胞分类和亚群分析,可以看出两个病人的癌组织的细胞图谱和细胞群体还是有差异的,所以非常建议做生物学重复,至少2-3个。
----------------------------------(2)----------------------------------------
英文题目:Slide-seq: A scalable technology for measuring genome-wide expression at high spatial resolution
中文题目:Slide-Seq:一种可扩展的高空间分辨率全基因组表达测量技术
发表期刊:Science
影响因子:41.037
发表时间:2019.03.29
Ø 摘要
细胞在组织中的空间位置强烈影响功能,但缺乏高通量、全基因组、细胞分辨率的基因表达读数。我们开发了Slide-seq,一种将RNA从组织切片转移到覆盖有已知位置的DNA条形码珠子的表面的方法,允许通过测序推断RNA的位置。使用Slide-Seq,我们定位了由单细胞RNA测序数据集识别的小脑和海马内的细胞类型,表征了小鼠小脑浦肯野层的空间基因表达模式,并定义了创伤性脑损伤小鼠模型中细胞类型特异性反应的时间演变。这些研究突出了Slide-seq如何提供了一种可扩展的方法,用于以与单个细胞大小相当的分辨率获得空间分辨的基因表达数据。
Ø 说明;
这篇文章主要是一个新的方法学的文章,同时用小鼠脑组织来测试了一下效果,就不多介绍。感兴趣的可以移步了解:Science | 新工具高分辨研究组织空间转录组
该方法空间分辨率高,并且简便易行,易于大规模应用。
但是,目前该方法RNA捕获效率还很低,大概每种细胞只能捕获2000到3000条RNA,对丰度低的RNA不敏感。另外,由于其只能测RNA单端部分序列,并不能分析RNA剪切信息。它和高通量FISH有很好的互补(善于标记低丰度RNA,并且可以分析不同的RNA剪切体)并且可以相互校准。
另外,使用反卷积算法准确分析每个Slide-seq小球抓取的细胞类型信息的前提是细胞RNA均质分布,而实际情况RNA分布异质性很强。将来使用更小的小球(比如2-5μm)让更多的小球只捕获单一细胞的RNA能够提高系统的准确性。(当然,如何整合更小小球的数据是对相关卷积/反卷积算法很大的挑战)。
------------------------------------(3)---------------------------------------
英文题目:High-density spatial transcriptomics arrays for in situ tissue profiling
中文题目:用于原位组织分析的高清晰度空间转录技术
发表期刊:Nature Methods
影响因子:28.467
发表时间:2019.09.09
Ø 摘要:
空间和分子特征决定了组织的功能,然而同时捕捉两者的高分辨率方法还很缺乏。在这里,我们开发了高清晰度空间转录学,它从密集的、空间条形码的微珠阵列上的组织切片中捕获RNA。每个实验都获取了几十万个2μm分辨率的转录耦合空间条形码,就像在小鼠脑和原发性乳腺癌中所展示的那样。这为细胞和组织的高分辨率空间分析开辟了道路。
Ø 说明:
这也是一篇方法学的文章,不再赘述,感兴趣可以移步:原位组织分析的高精度空间转录组学
值得一提的是,作者只测了3个样本。
------------------------------------(4)--------------------------------------
英文题目:Spatiotemporal dynamics of molecular pathology in amyotrophic lateral sclerosis
中文题目:肌萎缩侧索硬化症分子病理的时空动力学研究
发表期刊:Science
影响因子:41.037
发表时间:2019.04.05
Ø 摘要
肌萎缩侧索硬化症(ALS)导致的瘫痪,是由于运动神经元退化导致骨骼肌的失神经支配。运动神经元和胶质细胞之间的相互作用导致运动神经元丢失,但在完整的脊髓组织中驱动这些过程的分子事件的时空顺序仍然知之甚少。在此,我们使用空间转录学来测量小鼠脊髓在疾病过程中以及ALS患者的死后组织的基因表达谱,以表征ALS的潜在分子机制。我们确定了通路动力学,区分了早期时间点小胶质细胞和星形胶质细胞群体之间的区域差异,并识别了ALS小鼠模型和人类脊髓之间共有的几条通路的微小变化。
Ø 材料与方法
小鼠:SOD1-G93A(ALS)、SOD1-WT(对照),在症状前、发病、症状和终末期4个时间点,腰部脊髓L3至L5切片。共67只小鼠,1165张切片
人:腰部或球部起病的散发性ALS患者死后腰椎和颈髓组织,共11个病人,80张切片,4名临床表现为延髓症状,3名出现下肢症状的患者
共计331个ST测序数据(猜测是每3-4张切片放在1个array上去捕获和测序)
Ø 实验结果:
小鼠获得超过76000个空间基因表达测量点(spatial gene expression measurements ,SGEM),人的获得超过60000个空间基因表达测量点
根据作者的分层生成概率模型,可靠地定量了11138个小鼠基因和9624个人类基因在脊髓切片中的空间分布。主成分分析显示,大部分差异是由空间位置、疾病状态和基因型解释的,而不是通过批次效应。
小胶质细胞功能障碍早在症状出现之前就已发生,在ALS中先于星形胶质细胞功能障碍,并且靠近运动神经元。
TREM2和TYROBP介导的信号传递是小胶质细胞基因表达与疾病相关变化的早期步骤,并揭示了这些变化的时空顺序。
人和小鼠的ST数据结果相似,都证明ALS病理的严重程度与症状起病部位的接近有关-人类空间数据显示与这种接近相关的前角基因表达的变异性。无偏共表达分析显示,两个物种某些模块具有保守性。
人类表达模块1,包括涉及VEGF和谷氨酸信号的基因,在具有下肢发病部位的患者的腰椎切片中被减弱。人类表达模块3在症状发作近端的脊髓切片上减弱,这种衰减在后部白质和前角最为明显。KEGG分析表明,人类模块3富含几种途径,包括鞘脂、逆行内源性大麻素和WNT信号。这一发现,连同显示疾病相关动力学和富集鞘脂信号通路的人类和鼠子模块一起,强调了这一机制在ALS病理中的重要性。事实上,在ALS患者的脊髓和SOD1ALS的小鼠模型中,已经报道了糖鞘磷脂水平及其代谢的改变。鞘脂信号调节剂已被建议作为ALS的潜在治疗药物,并在ALS小鼠模型中改善疾病。
作者数据详细说明了鞘脂信号在多种细胞类型、脊髓区域和疾病阶段的动态,并为设计治疗药物提供了靶向机会。此外,数据的时空性质为调节这一通路活性的潜在治疗策略提供了洞察力。
Ø 结语
综上所述,作者提供了一个综合了分辨率、复制和生物扰动的时空、转录组范围的基因表达数据集。我们的程序允许我们从小鼠模型中得出推论,并在临床样本中进行测试。这些工作将成为促进进一步绘制中枢神经系统及其功能障碍模式图的资源。
Ø 补充
这篇文章ST测序样本量巨大,耗费不菲。值得说明的是,这篇文章和后面几篇文章,作者都是Joakim Lundeberg课题组,采用的都是Spatial Transcriptomics公司早期的技术,一张slide仅1007个spot,spot直径100um、点间距都200um,比目前10X的技术通量和分辨率更低。
--------------------------------------(5)-----------------------------------
英文题目:A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing Human Heart
中文题目:人心脏发育过程中全器官的基因表达和细胞图谱
发表期刊:Cell
影响因子:36.216
发表时间:2019.12.12
Ø 亮点:
重点介绍了人类心脏发生的时空基因表达模式,绘制了人胚胎心脏的细胞类型分布和空间组织图,深入分析了不同细胞类型在心脏发育中的作用,提供了一个公开可用的人类胚胎心脏网络资源。
Ø 摘要
人类心脏形态发生的过程尚不完全清楚。它的完整特征需要通过深入探索器官范围的单细胞空间分辨率的基因表达谱。在此,我们提出了一种分子方法,它揭示了胚胎心脏在三个发育阶段的细胞类型的全面转录图景,并将特定细胞类型的基因表达映射到特定的解剖结构域。通过单细胞空间转录组测序鉴定人胚胎心肌细胞类型,证实并丰富了胚胎心脏基因表达的空间注释。然后使用原位测序来提炼这些结果,并创建三个发育阶段的空间亚细胞图。最后,我们创建了一个公开可用的人类发育心脏的网络资源,以促进未来对人类心脏发生的研究。
Ø 材料与方法
分别在4.5~5、6.5、6.5~7和9PCW这4个时间点采集4种发育心脏组织,受孕后年龄和临床年龄通过临床超声和胚胎的分期解剖学标志确定。计算得出心脏组织的性别信息。具体地说,4.5-5和6.5 PCW的心脏是男性,而6.5-7和9 PCW的心脏是女性。对4.5、6.5和9PCW的心脏进行ST和ISS分析,而6.5-7PCW的心脏进行scRNAseq。将6.5和6.5-7PCW的样本作为生物重复样本,比较ST和scRNA-seq检测到的基因表达。在ST和ISS实验中,来自同一心脏组织的连续组织切片被认为是技术上的重复。但是,重要的是要注意,连续的部分高度相似,但不完全相同。具体切片情况如下,共计2个scRNA-seq和19个ST。
Ø 补充
这是Joakim Lundeberg教授的再一篇高分文章,采用scRNA+ST,采用的依然是旧版的ST芯片,如下。每张芯片上有6个array。
Ø 顺便再放Lundeberg课题组的其他几篇文章截图
1、在2018.6.20发表于Nature Communications的Spatial maps of prostate cancer transcriptomes reveal an unexplored landscape of heterogeneity,做了12张前列腺癌的ST切片,只分析了5910个区域。
2、在2018.1.1发表于Cancer Research的,黑色素瘤,做了4个黑色素瘤样本的4张ST切片,只分析了2200个区域。
3、在2018.6.19发表于SciRep关于牙周炎的
4、在2017.10.11发表于SciRep关于心脏组织的
5、在2016.11.16发表于SciRep的ST方法学文章
在数据库方面,目前中国科学院生物物理研究所陈润生院士课题组整理了多个数据集,形成了空间转录组数据库SpatialDB,包含由8种空间转录组技术(ST, Slide-seq , LCM-seq , seqFISH,MERFISH , Liver single cell zonation , Geo-seq and Tomo-seq)产生的24个数据集,这些数据来自5个物种,包括人类、小鼠、果蝇、秀丽隐杆线虫和斑马鱼。研究团队针对这些数据集进行了整合。网站是:https://www.spatialomics.org/SpatialDB/
目前空间转录组已发表文章如下: