Loading…

Addressing Polymorphism in Linguistic Phylogenetics

Understanding how languages change is important not only for the reconstruction of protolanguages and for estimating diversification dates (i.e. the dates when languages split), but also for the inference of evolutionary trees (or phylogenetic networks) of language families. We propose a parametric...

Full description

Saved in:
Bibliographic Details
Published in:Transactions of the Philological Society 2024-07, Vol.122 (2), p.191-222
Main Authors: Canby, Marc E., Evans, Steven N., Ringe, Donald, Warnow, Tandy
Format: Article
Language:English
Subjects:
Citations: Items that this one cites
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Understanding how languages change is important not only for the reconstruction of protolanguages and for estimating diversification dates (i.e. the dates when languages split), but also for the inference of evolutionary trees (or phylogenetic networks) of language families. We propose a parametric model of language change that addresses lexical polymorphism (two or more words for a given basic meaning) based on what is known about how languages change. Under our model, changes of state in lexical characters occur only due to semantic shift or borrowing, leading to (potentially brief) periods in which polymorphism is present. Across a wide range of model conditions, we find that a simple and natural modification to the maximum parsimony (MP) criterion (which seeks the tree with the fewest number of changes) to allow it to handle polymorphic characters has the best accuracy, substantially improving on well‐known Bayesian methods based on appearances and disappearances of words. We also provide a new analysis of Indo–European that takes polymorphism into account, finding support for a previous tree (Nakhleh et al., 2006) and a new tree that differs from the previous tree in the relationship between Italo‐Celtic and Tocharian. Résumé Comprendre l'évolution des langues est essentiel pour la reconstruction de proto‐langues et pour l'estimation des dates de diversification (i.e. les dates de divergences de langues), mais également pour l'inférence d'arbres évolutifs (ou réseaux phylogénétiques) des familles de langues. Nous proposons dans cette étude un modèle paramétrique de l'évolution des langues qui prend en compte le polymorphisme lexical (deux mots ou plus pour un seul sens donné) en se basant sur nos connaissances de l'évolution des langues. D'après notre modèle, les changements d'états de caractères lexicaux se produisent uniquement par changement sémantique ou emprunt, ce qui entraîne des périodes (potentiellement brèves) pendant lesquelles le polymorphisme est présent. A travers l'exploration d'un large éventail de conditions du modèle, nos résultats indiquent qu'une simple modification du critère de maximum de parcimonie (qui recherche l'arbre minimisant le nombre de changement), pour lui permettre de prendre en compte le traitement des caractères polymorphiques avec une meilleure précision, améliore considérablement les résultats par rapport aux méthodes bayésiennes standards basées sur l'apparition et la disparition de mots. Nous proposons également
ISSN:0079-1636
1467-968X
DOI:10.1111/1467-968X.12289