ATAC-seq,可以鉴定DNA的可触及区域(即未被组蛋白保护的开放区域)。该技术利用Tn5转座酶,将染色质开放区域切割下来,构建成测序文库。目前被广泛应用于基因表达调控研究。
由于其高灵敏和低起始量的样本需求,加之atac-seq与其他技术的良好一致性,使得该技术被广泛应用于动物及肿瘤方向研究。其实,在植物领域研究中,ATAC-seq亦有不错发挥。2018年,植物学著名期刊The Plant Cell报道了该技术在植物基因表达调控领域应用的新进展——
研究中采用四种不同植物(拟南芥、苜蓿、水稻、番茄)根尖细胞,以及拟南芥根毛区的有毛细胞和无毛细胞开展研究,利用ATAC-seq技术重点探讨了如下问题:
* ATAC-seq技术,进行纯化与否的效果,及与既往DNase-seq技术的结果一致性;
*讨论跨物种的植物之间,染色质开放区域具有怎样的相似或特异性特征;
技术流程
技术方法比较研究发现,同样是ATAC-seq,样本经过纯化后,与不经纯化的结果比,产生的结果一致性很高,但不经纯化(crude)的方法,含有大量细胞器基因组(~50%);纯化atac研究中,核基因组含量可达~90%以上(如下Table)。
此外,ATAC-seq与DNase-seq结果间相似度非常高(下图)。
在纯化(INTACT组)方法中检测到的ATAC信号富集区域(THS)基本也都出现在未纯化组和DNase-seq组研究结果中。
不同方法检测一致性比对,ATAC-seq与DNase-seq的大部分富集区域存在重叠;
三种方法统计的THS区域与基因组相关区域分布,三种方法一致性较高——大部分(~75%)THS出现在转录区域外,基本落在TSS上游2kb之内和TTS下游1kb之内。
在跨植物物种的染色质开放区域研究中发现:四个不同物种的染色质开放区具有一致性,对同源基因部分研究发现其转座酶可及性模式具有一定程度一致性(下图A);但不同物种间,THS分布特征有各自特点,较大基因组其平均间距也较大,大致成比例(下图B);四个不同物种THS分布领域主要在TSS上游2kb,靠近TSS会有更多THS分布(下图C);大部分的基因上游只有1个THS区域,THS数量分布在不同物种中比较类似,尤其在水稻、苜蓿和拟南芥中,番茄的差异较大(下图D)。
*研究筛选出373个直系同源基因,统计其上游THS数目:除番茄外,其他物种THS模式比较类似,其中拟南芥和苜蓿最相似(下图A);结合373种基因表达的情况看,THS分布于基因表达之间无明显相关性(下图B),说明基因表达调控是一个复杂工作网络。
*拟南芥THS区域富集获得四种转录因子(TFs)Motif:HY5、ABF3、CBF2、MYB77 .这四种TFs靶基因之间存在重叠(下图C),在根尖基因表达中起重要作用;通过聚类分析四个物种中不同类型TF靶基因分布比例:在跨物种比较中,出现比较一致性结果(下图D)。
研究的第三个问题,是针对拟南芥根毛区两种类型细胞(有毛细胞和无毛细胞)的染色质开放区与基因表达间的关系。对拟南芥的根尖、有毛细胞、无毛细胞的atac富集区域(THS)进行比较:三者相似度较高,但表皮细胞与根尖组织存在一定差异性(下图A);
为确认细胞类型之间的差异性,选用两个生物学重复确定THS存在,筛选出的THS中大部分为三者共有的调控位点没其中6562种为根毛和非根毛表皮特有,未在根尖出现——说明THS分布会造成差异性表达(下图B);ATAC-seq进行THS检验,可获得定量(开放程度的信号强度)结果,非定性结果——说明TF的结合难易程度而非开放区域是否存在(下图C);
THS与下游基因表达情况的相关性研究:富集位点比较——大部分基因与上游的单个THS相关(下图D)。
ABI5/MYB33可能是根毛表皮细胞中转录调控级联的顶端,其对应靶基因功能因此受到关注(下图C)。