1 原理简介
ATAC-seq技术由ATAC实验和高通量测序两部分组成,它是分子生物学研究染色质可接近性的技术。该技术在2013年首次被提出,作为MNase-seq、FAIRE-seq和DNAse-seq的替代或补充方法。ATAC-seq实验的关键部分是转座酶Tn5对样品基因组DNA的作用。
ATAC-seq采用突变的多活性转座酶,允许高效切割暴露的DNA和同时连接特定序列的接头。分离接头连接的DNA片段,通过PCR扩增后用于高通量测序。
ATAC(Assay for Transposase-Accessible Chromatin)
携带着接头(Adapter)的转座酶复合物进入到染色质开放区域,将处于松散状态的DNA片段化同时末端加上接头。特定成对的PCR引物在DNA片段扩增同时末端加上index,经分选纯化后即为可测序文库。
2 技术目标
ATAC-seq技术检测染色质开放区域,即Tn5酶可接近的DNA区域,将快速又敏感的表观遗传现象可视化。使用具有50,000个细胞的简单两步方案捕获开放的染色质位点。
转座子优先并入一般没有核小体(无核小体区域)或暴露DNA段的基因组区域。因此,基因组中某些基因座序列的富集表明该区域不存在核小体,处于DNA结合蛋白等核机器能进入的松散暴露状态,提供有关染色质区段转录活跃状态的信息。
ATAC-seq实验的测序部分通常将产生数百万个可以成功比对到参考基因组的高通量测序reads。每条reads指向在实验期间发生的一次切割事件在基因组上的位置。然后对比对到参考基因组上的reads进行计数,并创建具有碱基对分辨率的信号峰值(peak)。
在实验过程中DNA可接近的基因组区域(染色质开放区域)含有更多的测序reads(因为转座酶优先作用于这些位置)。这些开放位点区域可以进一步分为各种调节元件类型:启动子,增强子,绝缘子等。通过进一步的信息整合,如峰与转录起始位点的距离,产生处于开放区域作用下的基因列表;或计算开放区域内的高倾向结合某种特定蛋白的碱基序列(motif),得到活跃基因的上游调控因子,提供全基因组转录因子发生的信息。
ATAC-seq技术可以进行样本之间差异的染色质开放位点的比较,通常并不单独使用。作为检测表观遗传-染色质开放状态现象的方式,与样本基因表达谱紧密相连,从靶标基因的表观状态关联到表达水平,具有强大的数据挖掘作用。此外,通过关联基因组、外显子,染色质免疫共沉淀(组蛋白修饰或转录因子结合)测序信息,形成:表观调控-基因组-基因表达的完整调控链。
3 技术优势
采用转座酶法进行DNA片段化,将繁琐的DNA片段化、末端修复和接头连接反应等步骤变为一步简单的酶促反应,将实验耗时缩减到2-3小时。
实验步骤简化带来的备样时间跨度缩短和失误概率降低,使实验成功率和可重复性大大提升。
样本需求量从百万级别甚至千万级别降低到为50,000个细胞,相较于被替代技术,样本量缩减了至少1000倍,当样本收集困难时更显示出独特的优势。
4 ATAC-seq应用
肿瘤发育研究
Discoveryof Transcription Factors and Regulatory Regions Driving In Vivo TumorDevelopment by ATAC-seq and FAIRE-seq Open Chromatin Profiling
取果蝇眼内触角圆盘组织野生型和对应的不同时期的Rasv12 + scrib-/- mutation tumor样本,用ATAC-seq检测染色质开放图谱存在的差异。结果发现tumor和正常组织之间,早期肿瘤和晚期肿瘤之间,开放染色质区域存在数以千计的peak差异,说明处于开放状态的染色质区域有所区别。肿瘤中许多enhancer和promoter被激活,结合基因表达谱RNA-seq数据,证实染色质开放区域与临近基因的表达水平相关。
在染色质开放区域内扫描motif来寻找可能存在的转录因子调控,发现AP-1和Stat92E对于原癌基因表达和肿瘤的生长发育具有关键的调控作用。
肿瘤机制研究
Nfib Promotes Metastasisthrough a Widespread Increase in Chromatin Accessibility
选择人小细胞肺癌研究促进癌症扩散转移的背景机制。比较原发性和肝转移性的小细胞肺癌细胞之间的差异。两种类型分别来自于4只小鼠重复共计8个样本,利用ATAC-seq,发现NFI家族转录因子富集在差异的染色质开放位点中,预示着NFI家族转录因子在调控肿瘤细胞转移中扮演着重要角色。在染色质高开放性位点区域伴随着Nfib拷贝数量增大,且Nfib在侵袭性原发性肿瘤和转移性肿瘤内高表达,Nfib表现出维持染色质及远端调控区域开放和促进神经基因表达的功能,说明了Nfib对促进癌细胞增殖和迁移的重要作用及调控机制。
肿瘤细胞特性研究
Authentication andcharacterisation of a new oesophageal adenocarcinoma cell line: MFD-1
从55岁的男性病人中获取了一种新的食管癌细胞系:MFD-1,采用ATAC-seq方法与经典的食道癌细胞系OE33和人食管上皮细胞HET1A比较差异,进行MFD-1癌细胞特性研究,绘制MFD-1染色质开放位点图谱。和正常上皮细胞相比,MFD-1特异的染色质开放位点显著富集着CTCF、NFY、Meis3、Nrf2的motif,且这些位点附近基因富集在和上皮癌及消化道肿瘤相关的功能分组内。
结合全基因组测序(WGS)和表达谱测序(RNA-seq)技术,发现细胞系中4个基因(ABCB1、DOCK2、SEMA5A和TP53)存在5个突变位点,提供了MFD-1的基因表达特性。说明MFD-1能作为一种代表性的临床前原发性食管癌模式细胞系,可用于对应突变类型的研究。
疾病机理研究
ATAC-seq on biobankedspecimens defines a unique chromatin accessibility structure in naïve SLE Bcells
作者收集了3个来自生物样本库冻存系统性红斑狼疮(SLE)和1个新鲜的系统性红斑狼疮(SLE)样本,并取了4个健康对照(HC)。从样本中分离出CD19+ naïve B细胞,使用ATAC-seq实验找到SLE中特异602个染色质开放位点,和HC中461个特异开放位点。SLE中的特异开放位点临近基因具有白细胞分化,细胞活化功能,富集着NFKB,AP-1、BATF、IRF4和PRDM1的motif;而HC开放位点基因与转录调控相关的过程相关,富集着NRF1、CTCF和STAT5的motif,说明染色质上NRF1和BATF的结合影响了SLE和HC的开放位点。
细胞亚型研究
Integration of ATAC-seq andRNA-seq identifies human alpha cell and beta cell signature genes
为研究2型糖尿病,从人胰岛中分选出Alpha、Beta和Acinar三类细胞,采用ATAC-seq找到了和细胞类型紧密相关的染色质开放位点;找到2个和2型糖尿病发病风险相关的开放位点,可能和Alpha细胞功能紊乱相关联。确定了许多在a细胞或b细胞选择性表达的转录本,且这种表达模式和细胞染色质开放位点相关。
结合RNA-seq表达谱数据,定位了一些先前不知道在该类型细胞中表达的基因内的开放位点。定位了Alpha和Beta细胞内“标签基因”的新位点。motif分析找到了在本实验中新的富集转录因子,并发现了CTCF、STAT1在Alpha和Beta细胞中不同的调控作用。