On the Statistical Interpretation of Site-Specific Variables in Phylogeny-Based Substitution Models.

Rodrigue, N. (2013). « On the Statistical Interpretation of Site-Specific Variables in Phylogeny-Based Substitution Models. », Genetics, 193(2), p. 557-564. doi : 10.1534/genetics.112.145722  Accès au texte intégral (en anglais seulement)

Résumé

Fondée sur la phylogénie, la modélisation de l’hétérogénéité entre les positions d’alignement de séquences multiples est habituellement abordée selon deux perspectives principales. La première considère les spécificités de site comme des variables aléatoires issues d’une loi statistique, et la fonction de vraisemblance prend la forme d’une intégrale par rapport à cette loi. La deuxième perspective attribue une variable distincte à chaque position, et, dans le cadre du maximum de vraisemblance, ajuste ces variables, ainsi que les paramètres globaux, de manière à optimiser une fonction de vraisemblance conjointe. Rappelons que si la première approche bénéficie des garanties statistiques de la théorie classique de la vraisemblance, la deuxième ne requiert aucune précaution particulière si les variables propres aux sites sont des variables en grande dimension. En utilisant un cadre de sélection de mutations fondé sur la phylogénie, nous montrons que la différence dans l’interprétation des variables propres aux sites permet d’expliquer les disparités des études récentes concernant la distribution des coefficients de sélection.

Date de modification :