Sequence-based deep learning techniques for protein-protein interaction prediction
Sequence-based deep learning techniques for protein-protein interaction prediction
Enllaç permanent
Descripció
Resum
Les interaccions Proteïna-Proteïna (PPIs) són fonamentals per comprendre malalties i descobrir medicaments. La identificació experimental de les PPIs és limitada, per la qual cosa s’utilitzen mètodes computacionals. Aquest projecte explora tècniques tradicionals de Processament del Llenguatge Natural (NLP) i proposa un enfoc innovador que combina embeddings contextuals amb un model unicament decodificador per predir les PPIs. El model de referència aconsegueix una precisió del 54% utilitzant una arquitectura profunda de CNN-BiLSTM amb atenció. Mitjançant l’ús d’embeddings de complexos de PPIs en un model proteic preentrenat i predint amb un model unicament decodificador, s’assoleix una precisió superior al 65% en sets de prova. Remarcablement, aquest enfoc demostra un bon rendiment en els diferents dominis applicats.Descripció
Treball de fi de grau en Bioinformàtica. Curs 2022-2023
Tutor: Alexis Molina