Structure based MSA evaluation

Enllaç permanent

Descripció

  • Resum

    Aquest projecte es centra en la necessitat de desenvolupar un mètode per definir la precisió d’un Alineament Múltiple de Seqüències mitjançant l’assignació d’un valor de precisió a cada una de les seqüències que constitueixen d’acord a com de ben alineades estan. Per a predir correctament aquests valors, hem probat dos mètodes en les seqüències de l’alineament que tenen una estructura guardada en PDB, les cuals seran considerades biològicament correctes, per la qual cosa es pot saber la seva precisió real en l’alineament. El millor mètode ha resultat ser el k-NN (k veïns més propers).
    Este proyecto se centra en la necesidad de desarrollar un método para definir la precisión de un Alineamiento Múltiple de Secuencias mediante la asignación de un valor de precisión a cada una de las secuencias que lo componen de acuerdo a lo bien alineadas que estén. Para predecir correctamente estos valores, hemos probado dos métodos en las secuencias de alineamiento que tienen una estructura guardada en PDB, las cuáles suelen ser consideradas biológicamente correctas, para así poder saber su precisión real en el alineamiento. El mejor método ha resultado ser el k-NN (k vecinos más próximos).
    This project focuses on the need of developing a method to define the accuracy of a Multiple Sequence Alignment by being able to assign an accuracy score to each of its composing sequences according to how good their alignment is. In order to correctly predict these scores for the sequences, two methods were tested on the sequences of the alignment that have a structure stored in PDB, which are usually considered biologically correct, so we can know their real accuracy in the alignment. The best performing method turned out to be the k-Nearest Neighbour method.
  • Descripció

    Treball de fi de grau en Bioinformàtica. Curs 2019-2020
    Tutors: Cedric Notredame, Leila Mansouri
  • Mostra el registre complet