Optimization of alignment preprocessing used as input on a residual neural network for substitution model selection

dc.contributor.authorVega Méndez, Antón
dc.date.accessioned2022-11-30T10:23:29Z
dc.date.available2022-11-30T10:23:29Z
dc.date.issued2022-06-21
dc.descriptionTreball de fi de grau en Bioinformàtica. Curs 2021-2022ca
dc.descriptionTutor: Sebastian Burgstaller-Muehlbacherca
dc.description.abstractQuan es realitza la reconstrucció d'un arbre filogenètic, sovint veiem que l'ús d'un model incorrecte d'evolució pot produir un arbre mal modelat, i l'ús dels mètodes utilitzats comunament per fer-ho pot ser computacionalment costós i propens a errors. ModelRevelator utilitza aprenentatge profund per decidir quin model d’evolució utilitzar per a un determinat anàlisi de seqüències múltiples. En aquest projecte, vaig intentar millorar el rendiment d'una de les xarxes neuronals de ModelRevelator utilitzant una estrategia diferent per al preprocessament de la informació continguda a les alineacions de seqüències múltiples: Seleccionant aleatòriament subset de les alineacions, vaig calcular un conjunt d'estadístiques continguda en cada subset per millorar els mètodes anteriors.ca
dc.description.abstractAl realizar la reconstrucción de un árbol filogenético, a menudo vemos que el uso de un modelo incorrecto de evolución puede producir un árbol mal modelado, y el uso de los métodos usados comunmente para hacerlo puede ser computacionalmente costoso y propenso a errores. ModelRevelator utiliza aprendizaje profundo para decidir qué modelo de evolución utilizar para un determinado análisis de secuencias múltiples. En este proyecto, intenté mejorar el rendimiento de una de las redes neuronales de ModelRevelator utilizando un enfoque diferente para el preprocesamiento de la información contenida en las alineaciones de secuencias múltiples: Seleccionando aleatoriamente subsets de las alineaciones, calculé un conjunto de estadísticas contenida en cada uno de los subsets para mejorar los resultados anteriores.
dc.description.abstractWhen performing phylogenetic tree reconstruction, we often see that the use of an incorrect model of sequence evolution can lead to a wrongly modeled tree, and using established methods to do so can be computationally expensive and prone to errors. ModelRevelator uses deep learning to decide which model of sequence evolution to use for a certain multiple sequence analysis. In this project, I tried to improve the performance of one of ModelRevelator’s neural networks by using a different approach to preprocessing the information contained in multiple sequence alignments: By randomly selecting subsets of the alignments I computed a set of summary statistics summarizing the information contained in each one to improve previous methods.en
dc.format.mimetypeapplication/pdf*
dc.identifier.urihttp://hdl.handle.net/10230/55050
dc.language.isoengca
dc.rightsThis is an Open Access article distributed under the terms of the Creative Commons Attribution-NonCommercial-NoDerivs 3.0 licenseca
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessca
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/ca
dc.subject.keywordFilogenèticaca
dc.subject.keywordAprenentatge profundca
dc.subject.keywordSelecció de models de substitucióca
dc.subject.keywordFilogenética
dc.subject.keywordAprendizaje profundo
dc.subject.keywordSelección de modelos de substitución
dc.subject.keywordPhylogeneticsen
dc.subject.keywordDeep learningen
dc.subject.keywordSubstitution model selectionen
dc.subject.otherTreball de fi de grau – Curs 2021-2022ca
dc.titleOptimization of alignment preprocessing used as input on a residual neural network for substitution model selectionca
dc.typeinfo:eu-repo/semantics/bachelorThesisca

Files

License

Rights