进化树专题(九)| 从DNA序列到分化时间——如何构建带分歧时间的进化树?

关于带时间节点的系统发育树,先给大家看一个例子:
分支带有物种的分化时间,并添加了分化时间的置信度范围(右图蓝色数字为分化时间)。
图片引用自:
Guo Longbiao#, Jie Qiu#, …, Lianyang Bai*, Longjiang Fan*. Echinochloa crus-galli genome analysis provides insight into its adaptation and invasiveness as a weed. Nature Communications, 2017.
Haibin Xu#, Jingyuan Song# , ..., Xiaoquan Qi3,* and Shilin Chen*. Analysis of the Genome Sequence of the Medicinal Plant Salvia miltiorrhiza .Molecular Plant, 949-952, June 2016.


分化时间是当前宏观进化分析的一个热点,以某一个或某几个特定类群的化石时间作为参照,通过基因序列间的分歧程度以及分子钟来估计分支间的分歧时间,同时计算系统发育树上其它节点的发生时间,从而推断相关类群的起源和不同类群的分歧时间。

根据分子钟理论,基因序列中密码子随着时间的推移以几乎恒定的比例相互替换,即具有恒定的演化速率,两个物种之间的遗传距离将与物种的分化时间成正比。我们通常采用单拷贝基因家族中的四重简并位点来估算分子钟(替换速率)以及物种间的分化时间,密码子中的四重简并位点由于第三碱基不改变所编码的氨基酸,属于中性进化,其中中性替换速率一般用每个位点每年的变异数来衡量。

利用贝叶斯统计或其他方法估计物种分歧时间的程序很多,如R8SMCMCTREEMULTIDIVTIMEBEAST等,通过不同的策略将化石时间信息整合到一个系统发育树中,从而计算得到Divergence time Tree

下面我们对构建Divergence time Tree的方法和步骤做一个简述:

01构建系统发育树


利用单拷贝基因的CDSPEP序列构建系统发育树,推荐PhyMLMrbayes 。因为ML树和贝叶斯进化树对核苷酸 / 氨基酸替代模型的选择非常敏感,故在进行进化树或分化时间构建之前,需对核苷酸 / 氨基酸替代模型进行选择

构建获得 newick格式的进化树,如下例子:


02获得fossil calibration time


那如何查两两物种间的化石分化时间?

通过网站http://www.timetree.org/ ,该网站根据多篇文献支持提供两两物种间的分化时间,并给出置信度范围,单位是Mya(million years ago)。另外一个可以查询分化时间的网站是https://fossilcalibrations.org/ ,可以互相参考。

在已经构建好的树中添加化石时间,主要形式是 '>0.22<6.75''>'后接分化时间的最小值,'<'后接最大值,如下实例:

当样本比较多时,要考虑不同距离的节点,只有一个节点估算的可能不准确,可以提供三到五个的节点(物种)的分化时间。

03分歧时间估计


这里主要介绍3种程序:


1. 使用 r8shttps://sourceforge.net/projects/r8s/)估计分歧时间,速度很快,一般时间<10min

准备配置文件r8s.ctl

运行程序:

2. 使用multidivtimehttps://brcwebportal.cos.ncsu.edu/thorne/multidivtime.html) 估计分歧时间,时间~5hours

-> 先利用PAML baseml估计分支的核苷酸频率、转换/颠换率等参数


-> 再利用paml2modelinfbaseml输出文件转换为estbranches输入文件

-> 利用estbranche对树分支长度进行最大似然率估计

输入文件是前一步的输出结果

-> 运行multidivtime进行分歧时间估计

利用前一步的输出,准备配置文件divtime.ctl,运行程序


3. 使用 PAML mcmctreehttp://abacus.gene.ucl.ac.uk/software/paml.html) 估计分歧时间,强烈推荐,时间~20hours

准备配置文件 mcmctree.ctl

运行程序:

04结果展示


计算完成后,就获得了带分歧时间的进化树了~~

当然这只是最基本的例子,后续可以对进化树进行一系列美化操作。整个过程还需要自己操作一遍,毕竟实践出真知~~~

[参考资料]:

https://brcwebportal.cos.ncsu.edu/thorne/multidivtime.html

http://abacus.gene.ucl.ac.uk/divtimes/index.html

分享