ATAC-seq解析作物根部基因表达调控机制并发现新的控制模块

ATAC-seq,可以鉴定DNA的可触及区域(即未被组蛋白保护的开放区域)。该技术利用Tn5转座酶,将染色质开放区域切割下来,构建成测序文库。目前被广泛应用于基因表达调控研究。

由于其高灵敏和低起始量的样本需求,加之atac-seq与其他技术的良好一致性,使得该技术被广泛应用于动物及肿瘤方向研究。其实,在植物领域研究中,ATAC-seq亦有不错发挥。2018年,植物学著名期刊The Plant Cell报道了该技术在植物基因表达调控领域应用的新进展——

研究中采用四种不同植物(拟南芥、苜蓿、水稻、番茄)根尖细胞,以及拟南芥根毛区的有毛细胞和无毛细胞开展研究,利用ATAC-seq技术重点探讨了如下问题:

* ATAC-seq技术,进行纯化与否的效果,及与既往DNase-seq技术的结果一致性;

*讨论跨物种的植物之间,染色质开放区域具有怎样的相似或特异性特征;

*研究同一物种内(拟南芥)不同类型细胞间染色质开放区域调控模式的异同,解析细胞的类型特异性基因表达调控机制。


技术流程


技术方法比较研究发现,同样是ATAC-seq,样本经过纯化后,与不经纯化的结果比,产生的结果一致性很高,但不经纯化(crude)的方法,含有大量细胞器基因组(~50%);纯化atac研究中,核基因组含量可达~90%以上(如下Table)。

此外,ATAC-seqDNase-seq结果间相似度非常高(下图)。

在纯化(INTACT组)方法中检测到的ATAC信号富集区域(THS)基本也都出现在未纯化组和DNase-seq组研究结果中。

不同方法检测一致性比对,ATAC-seqDNase-seq的大部分富集区域存在重叠;

三种方法统计的THS区域与基因组相关区域分布,三种方法一致性较高——大部分(~75%THS出现在转录区域外,基本落在TSS上游2kb之内和TTS下游1kb之内。

在跨植物物种的染色质开放区域研究中发现:四个不同物种的染色质开放区具有一致性,对同源基因部分研究发现其转座酶可及性模式具有一定程度一致性(下图A);但不同物种间,THS分布特征有各自特点,较大基因组其平均间距也较大,大致成比例(下图B);四个不同物种THS分布领域主要在TSS上游2kb,靠近TSS会有更多THS分布(下图C);大部分的基因上游只有1THS区域,THS数量分布在不同物种中比较类似,尤其在水稻、苜蓿和拟南芥中,番茄的差异较大(下图D)。

接着,学者对不同物种间染色质开放区域及调控元件特征进行了研究,用以说明跨物种的直系同源基因其调控元件是否具有保守性:

*研究筛选出373个直系同源基因,统计其上游THS数目:除番茄外,其他物种THS模式比较类似,其中拟南芥和苜蓿最相似(下图A);结合373种基因表达的情况看,THS分布于基因表达之间无明显相关性(下图B),说明基因表达调控是一个复杂工作网络。

*拟南芥THS区域富集获得四种转录因子(TFsMotifHY5ABF3CBF2MYB77 .这四种TFs靶基因之间存在重叠(下图C),在根尖基因表达中起重要作用;通过聚类分析四个物种中不同类型TF靶基因分布比例:在跨物种比较中,出现比较一致性结果(下图D)。

研究的第三个问题,是针对拟南芥根毛区两种类型细胞(有毛细胞和无毛细胞)的染色质开放区与基因表达间的关系。对拟南芥的根尖、有毛细胞、无毛细胞的atac富集区域(THS)进行比较:三者相似度较高,但表皮细胞与根尖组织存在一定差异性(下图A);

为确认细胞类型之间的差异性,选用两个生物学重复确定THS存在,筛选出的THS中大部分为三者共有的调控位点没其中6562种为根毛和非根毛表皮特有,未在根尖出现——说明THS分布会造成差异性表达(下图B);ATAC-seq进行THS检验,可获得定量(开放程度的信号强度)结果,非定性结果——说明TF的结合难易程度而非开放区域是否存在(下图C);

THS与下游基因表达情况的相关性研究:富集位点比较——大部分基因与上游的单个THS相关(下图D)。

针对根毛表皮及非根毛表皮种THS区富集的转录因子TFs筛选出5个常见转录因子家族(下表),选择其中三个TFs的高置信度靶基因分析:

根毛表皮中的TFs靶基因会在根毛中有大比例高表达。在非根毛中表达比例降低但也存在——可能是中性TF或阻遏物区域(下图A);三个TFs的靶基因有重叠——说明TFs之间存在强相关的调控关系三者的共有靶基因也有一部分是细胞类型特异性高表达的(下图B);

ABI5/MYB33可能是根毛表皮细胞中转录调控级联的顶端,其对应靶基因功能因此受到关注(下图C)。

研究进一步挖掘了ABI5/MYB33转录因子在根毛细胞中富集的靶基因,获得7个靶基因的信息,其中值得关注的是MYB77MYB44,这二者下游分别有千种以上的靶基因,并具有近500种共同的靶基因,此外,它们两者彼此之间可以互相调控,MYB77还可以调节自身的基因表达——如此,该体系可以同时控制细胞调节器和非生物应激反应,是一个根毛细胞特有的调控模型(如下)。

分享