Influence of alignment uncertainty on homology and phylogenetic modeling
Influence of alignment uncertainty on homology and phylogenetic modeling
Enllaç permanent
Descripció
Resum
Most evolutionary analyses are based upon pre-estimated multiple sequence alignment models. From a computational point of view, it is too complex to estimate a correct alignment, as it is to derive a correct tree from that alignment. Several works have recently reported on the influence of alignment on downstream analysis, and on the uncertainty inherent to their estimation. Chapter 1 develops the notion of alignment uncertainty as either inherent to the data (internal) or resulting from methodological biases (external). Chapter 2 presents two contributions of mine for the improvement of MSA methods through the use of homology extension (TM-Coffee) and thanks to an improved word-matching algorithm (SymAlign). In Chapter 3, I show how alignment uncertainty can be used to improve the trustworthiness of phylogenetic analysis. Chapter 4 shows how a similar improvement can be obtained through a simple adaptation of the T-Coffee transitive score, thus allowing downstream analysis to take into account internal alignment uncertainty. The final chapter contained a discussion of our current results and possible future work.
La mayoría de los análisis evolutivos están basados en modelos establecidos de alineamiento de secuencia múltiple. Desde un punto de vista computacional, es igual de complejo la estimación de un alineamiento correcto, como la obtención de un árbol correcto a partir del alineamiento. Recientemente varios trabajos han informado sobre la influencia del alineamiento en los análisis posteriores, y en la incertidumbre inherente a su estimación. El Capítulo 1 desarrolla el concepto de incertidumbre de alineación, tanto inherente a los datos (internos), como resultante de los sesgos metodológicos (externo). El Capítulo 2 presenta dos contribuciones mías para la mejora de los métodos de MSA a través del uso de la extensión de homología (TM‐Coffee) y gracias a un algoritmo de coincidencia de palabra mejorado (SymAlign). En el capítulo 3, se muestra cómo la incertidumbre de alineación puede ser utilizada para mejorar la confiabilidad del análisis filogenético. El capítulo 4 nos muestra como se puede obtener una mejora similar por medio de una simple adaptación de la puntuación transitiva del T-- Coffee, lo cual permite un análisis posterior para tener en cuenta la incertidumbre de alineación interna. El último capítulo contiene un análisis de los resultados actuales y los posibles futuros trabajos.
Programa de doctorat en BiomedicinaDirector i departament
Col·leccions
Mostra el registre complet