Valverde Sanchez, Clàudia2024-04-262024-04-262023-06-21http://hdl.handle.net/10230/59923Treball de fi de grau en Bioinformàtica. Curs 2022-2023Tutor: Alexis MolinaLes interaccions Proteïna-Proteïna (PPIs) són fonamentals per comprendre malalties i descobrir medicaments. La identificació experimental de les PPIs és limitada, per la qual cosa s’utilitzen mètodes computacionals. Aquest projecte explora tècniques tradicionals de Processament del Llenguatge Natural (NLP) i proposa un enfoc innovador que combina embeddings contextuals amb un model unicament decodificador per predir les PPIs. El model de referència aconsegueix una precisió del 54% utilitzant una arquitectura profunda de CNN-BiLSTM amb atenció. Mitjançant l’ús d’embeddings de complexos de PPIs en un model proteic preentrenat i predint amb un model unicament decodificador, s’assoleix una precisió superior al 65% en sets de prova. Remarcablement, aquest enfoc demostra un bon rendiment en els diferents dominis applicats.application/pdfengThis is an Open Access article distributed under the terms of the Creative Commons Attribution-NonCommercial-NoDerivs 3.0 licenseTreball de fi de grau – Curs 2022-2023Sequence-based deep learning techniques for protein-protein interaction predictioninfo:eu-repo/semantics/bachelorThesisEmbeddings contextualsAprenentatge profundInteraccions proteïna-proteïnaModels de llenguatge proteicsEmbeddings contextualesAprendizaje profundoInteracciones proteína-proteínaModelos de lenguaje proteicosContextual embeddingDeep Learning (DL)Protein-Protein Interaction (PPI)Protein Language Model (PLM)Transformersinfo:eu-repo/semantics/openAccess