牛瘤胃的宏基因组测序组装出913个微生物基因组

宏基因组研究听说过吗?


知道啊,把环境微生物一网打尽的研究,很多做微生态的老师都用这种方法关注微生物组的群落结构和功能。


用宏基因组不仅仅能做这些!


听说了,还能利用宏基因组的数据做单菌的基因组研究,效果不一般呐。


对喽,如果你还不知道宏基因组测序还能做这些,你就OTU啦~ 今天,给大家分享一篇经典的宏基因组研究文献,看看大牛们是如何利用最新最火的研究手段,玩儿转微生物组的。


640.png

牛瘤胃的宏基因组测序组装出913个微生物基因组


640.png

牛瘤胃适合于将植物材料分解为能量和营养素,这一主要过程是由瘤胃微生物合成的酶类完成的。在此研究中,基于宏基因组研究手段对43头苏格兰奶牛瘤胃进行测序共获得超过800G的数据,基于宏基因组binning和Hi-C的proximity-guided组装方法,获得913株细菌和古菌的基因组框架图。这些基因组中大多数是此前未被测序过的菌株和物种。这些基因组框架图含有超过69,000种与碳水化合物代谢相关的蛋白,其中90%以上在数据库中无法良好匹配。相较于研究者自有数据库及已公开的瘤胃数据库,本研究中组装出的913株基因组极大的提升了宏基因组reads的分类注释效果,将公共瘤胃数据库中的数据量扩大了5倍。因此,本研究数据集可大大提高公共数据库中瘤胃微生物基因组的覆盖范围,并为生物质降解酶类发现及瘤胃微生物组研究提供了宝贵的资源。


宏基因组测序+ Hi-C技术+单据基因组框架图能碰撞出什么样的火花?

请看本文的精彩设计~

1.jpg

好了,那么多的细菌和古菌的基因组框架图都得到了,下一步呢?



遗传进化,是生物学研究亘古不变的问题

果不其然,大牛们也首先关注了这个话题:913株组瘤胃微生物,又能告诉我们什么呢?

3.jpg

这913株菌与前人研究关注的15个已发布的瘤胃相关物种共同构建系统发育树,从结果可以看出,该进化树主要含两个较大的分支簇梭菌和类杆菌类(Clostridiales&Bacteroidales),紧跟着比较重要的是是普雷沃氏菌簇(Prevotellaceae),和一些其他较小的分支构成(如变形杆菌、古细菌、放线菌等)。

在这个研究中构建出的RUGs 有10种可以被鉴定到种水平,并已有相关研究这些菌参与瘤胃代谢的过程。剩下906个RUGs则被不同程度的注视到属以上水平,其中有28个鉴定为古细菌。整个研究看,获得的很多RUGs确为瘤胃常见物种;而基于宏基因组构建的MAGs和Hi-c方法构建的基因组在门水平的分布十分相似。


◆◆◆◆◆◆◆◆◆

就此,瘤胃的微生物构成和系统进化关系就列举明白了。接下来做什么呢?那必须是功能研究啊!背景介绍了,瘤胃的一个主要作用是分解植物为营养素和能量,在此过程中碳水化合物酶功不可没。也因此,碳水化合物活性酶(CAZy)成为下一个关注点》》》

◆◆◆◆◆◆◆◆◆


913个RUGs共含有1979391个预测蛋白,通过CAZys数据库比对,共有69,678个至少含有一项碳水化合物活性功能。而这些蛋白质中,只有6061个与数据库高度匹配,也就意味着剩下63617个蛋白是本研究预测新发现的碳水化合物活性蛋白,即便进行了聚类和去冗余处理,仍有数以万计的新clusters

碳水化合物活性酶类在913株RUGs中的分布情况如左图。横轴为CAZy数据库划分的六大类相关酶类简称。

从分析中可以看出,913个RUGs中糖基水解酶类(GHs)和糖基转移酶类(GTs)是含有量最高的。这两类酶主要在PrevotellaceaeBacteroidalesFibrobacteres和一些Clostridiales菌中,古细菌和变形杆菌的大部分RUGs中不存在。

4.jpg

研究还探讨了RUGs的六大类碳水化合物活性酶类相比于其他五个公共数据库的同一性(下图)。同一性均值可达65%以上,最高的是AAs,氨基酸一致性可达83%

5.jpg


◆◆◆◆◆◆◆◆◆

接下来,研究重点关注了基因组中与碳水化合物酶类作用的多糖结合位点(PUL),以此来研究与特定碳水化合物底物相关的基因组模式》》》

◆◆◆◆◆◆◆◆◆


CAZys是结合在PUL上发挥功能的,因此,可以通过特定PUL预测微生物菌株利用底物的特异性。本研究中利用203个RUG获得了1743个假设PUL。其中有187个RUGs都含有1个以上PUL,PUL持有量最多的是RUG144和RUG423,分别含37个和35个PUL,在系统进化中,这两个RUGs也是密切相关的。结合系统进化研究发现,系统中的两个较大的分支簇(Clostridiales&Bacteroidales)可利用多种的底物,两者之间共用底物较多,还有一些是各自特异性的底物。研究还分析了特定酶类的出现与相关PUL的数目,探讨了它们在瘤胃消化过程中扮演的角色。并深入研究了富集PUL的作用。

基于RUGs进行物种注释到细菌界的物种,有31种的重要蛋白都比对上Solobacterium,Coprobacillus,Kandleria属,这三个属都是Erysipelotrichales目的物种。结合公共数据库信息及既往的研究,最终确定这31个MAGs是ErysipelotrichaeceaeCoprobacillaceae科的新分支,扩充了参考数据库的信息。利用本研究获得的宏基因组reads进行了7种不同数据库的比对注释(基于Kraken)。结果如下图:


6.jpg


不难发现,不同数据库的分类效果不同。在增加了Hungate1000计划和本研究发现的特异性细菌和古菌之后,整体分类比对率得到有效提升。


◆◆◆◆◆◆◆◆◆

研究最后,科学家们还比对了不同的研究方法之间的区别》》》》

◆◆◆◆◆◆◆◆◆


利用宏基因组数据结果,比较常规MAGs组装和基于Hi-C的单菌框架图组装结果,发现常规测序的binning构建单菌的方法可能获得更多的MAGs,推测这与常规方法会缺少质粒的信息相关。研究从计算角度给出了相应的说明。基于Hi-C的方法效果会与MAGs构建方法一样好,且框架图具有更低的污染率优势。


分享