在第一篇分享中,我们介绍过进化树的类型有基因树和物种树的划分(进化研究专题(一) | 我有一棵树 穿越数万年)。研究中发现,没有任何一个由单个基因构建出来的演化树与物种树完全一致。造成这一情况有一个非常重要的原因——不完全谱系分选(incomplete lineage sorting),即由于物种分化时间极其短,使得祖先基因的多态性在分化的物种里随机的固定下来。这种现象也为构建系统演化树带来了极大的障碍。
为解决此问题,研究人员采取了一种新的计算方法,提出基于溯祖理论利用综合的基因树来推断全基因组水平的物种树的软件:ASTRID
ASTRID的论文2015年发表后,已经被引用了83次
https://github.com/pranjalv123/ASTRID-1CMake (https://cmake.org/)Boost (http://www.boost.org/)DendroPy version 4 or greater https://pythonhosted.org/DendroPy/tar zxvf ASTRID-2_2_1-linux.tar.gz
ASTRID [-h] -i INPUT [-b --bsfile BSFILE] [--bslist BSLIST [BSLIST ...]] [-r --bsreps BSREPS] [-o OUTPUT] [-m METHOD] [-c CACHE] [--taxon-cutoff TAXON_CUTOFF]ASTRID: Accurate Species TRees from Internode Distances.-i INPUT File containing gene trees as newick strings-b --bsfile BSFILE 每个基因bootstrap构建的进化树;一个基因一行-m METHOD 基于距离的方法使用 (默认: fastme 其他:bionj)

/path/RAxML_bootstrap.gene1 文件格式
(((((samp1,6),(((('samp2',(73,'samp3')),((((samp4,samp5),(((samp6,samp7),(((samp8,samp9),...,samp9));ASTRID -i number.gene.tre -r 1000 -b number.gene.bootstrap.tre.lst -o ASTRID.trejava -jar astral.5.6.3.jar -i number.gene.tre -q ASTRID.tre > ASTRID.final.tre
https://bmcgenomics.biomedcentral.com/articles/10.1186/1471-2164-16-S10-S3