Phylogenetic trees are simple models of evolutionary processes. They describe conditionally independent divergent evolution of taxa from common ancestors. Phylogenetic trees commonly do not have enough flexibility to adequately model all evolutionary processes. For example, introgressive hybridization, where genes can flow from one taxon to another. Phylogenetic networks model evolution not fully described by a phylogenetic tree. However, many phylogenetic network models assume ancestral taxa merge instantaneously to form ``hybrid'' descendant taxa. In contrast, our convergence-divergence models retain a single underlying ``principal'' tree, but permit gene flow over arbitrary time frames. Alternatively, convergence-divergence models can describe other biological processes leading to taxa becoming more similar over a time frame, such as replicated evolution. Here we present novel maximum likelihood-based algorithms to infer most aspects of $N$-taxon convergence-divergence models, many consistently, using a quartet-based approach. The algorithms can be applied to multiple sequence alignments restricted to genes or genomic windows or to gene presence/absence datasets.


翻译:系统发育树是进化过程的简化模型,描述了类群从共同祖先出发的条件独立发散演化。然而,系统发育树通常缺乏足够的灵活性来充分建模所有进化过程,例如基因渗入杂交——即基因可从一类群流向另一类群。系统发育网络模型能够描述系统发育树无法完全涵盖的进化现象,但许多系统发育网络模型假设祖先类群瞬时合并形成“杂交”后代类群。相比之下,本文提出的收敛-发散模型保留了单一的底层“主干”树结构,同时允许基因在任意时间尺度上流动。此外,该模型还可描述其他导致类群在特定时间段内趋同的生物过程,例如重复进化。本研究基于最大似然法提出了新颖算法,通过四分类群方法推断N-类群收敛-发散模型的大部分特征(多数具有一致性)。该算法适用于局限于基因或基因组窗口的多序列比对数据,也可应用于基因存在/缺失数据集。

0
下载
关闭预览

相关内容

【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络
专知会员服务
21+阅读 · 2022年3月8日
图节点嵌入(Node Embeddings)概述,9页pdf
专知
15+阅读 · 2020年8月22日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关VIP内容
【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络
专知会员服务
21+阅读 · 2022年3月8日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员