Résumé de la thèse de doctorat
Translations: enDatations dans les arbres de gènes :spéciations, duplications, pertes
Archive officielle de la thèse
Les duplications de gènes sont un processus mutationnel quantitativement essentiel à la construction du génome, et crucial à l’apparition de nouvelles fonctions. Nous développons une procédure d’analyse de l’ensemble des duplications de gènes chez les vertébrés, en nous basant sur les arbres de gènes fournis par la ressource Ensembl.
L’objectif est d’établir des taux de duplications à fine résolution temporelle, en datant les événements de duplication en millions d’années. La méthode se décompose en trois étapes~: d’abord le nettoyage et filtrage des données d’entrée, puis le calcul du nombre de substitutions synonymes sur chaque branche des arbres, et enfin la conversion en âge absolu à l’aide d’un modèle d’horloge moléculaire flexible. Nous appliquons dans un premier temps cette méthode sur un contrôle (les nœuds de spéciation), afin de mesurer la précision de la datation. Profitant de l’exhaustivité des données de gènes disponibles, nous déterminons grâce à ce contrôle les caractéristiques qui influencent la qualité de la datation. Cette méthode et ses résultats sont nouveaux à cette échelle phylogénétique et sont un premier pas nécessaire pour tester d’autres hypothèses sur les duplications.
Ce contrôle de l’intervalle de confiance dans les datations moléculaire révèle une grande hétérogénéité des taux d’évolution, à la fois intra-génomique (différents gènes ont des taux de substitution très variables) et inter-lignée (différentes lignées d’espèces et leurs ancêtres ont des taux de substitution différents). Nous cherchons donc dans une deuxième partie à déterminer les raisons de cette hétérogénéité, méthodologiques (annotation des séquences) ou biologiques (points chauds de recombinaison, taux de diversification des espèces, etc).
Enfin nous avons étudié les phénotypes humains d’hétérotaxie, ou troubles développementaux de la polarisation gauche-droite, sur la base de comparaisons multi-espèces : la voie développementale impliquée ayant une répartition phylogénétique particulière, il est possible de détecter des gènes candidats ayant suivi la même évolution (en gains et pertes de fonction). Nous avons appliqué cette approche pour détecter des séquences régulatrices candidates.
Ma thèse vise donc à caractériser les duplications de gènes, à l’échelle génomique, par l’application de méthodes phylogénétiques basées sur la comparaison inter-espèces. Nous apportons un outil méthodologique de datation, ainsi que des résultats empiriques à large échelle, pouvant servir de référence pour étudier le lien entre duplications et les autres processus évolutifs.