Machine learning methods of property prediction in drug discovery
Loading...
Document Type
Document Version
Author
Director
De Fabritiis, Gianni
Tutor
Other authors
Publication Date
Pages
279 p.
Embargo date
Citation
Schapin, N. Machine learning methods of property prediction in drug discovery. Universitat Pompeu Fabra; 2024. handle: http://hdl.handle.net/10803/692716
This citation was generated automatically.
Citation
Doctoral program
Programa de Doctorat en Biomedicina
Abstract
Molecular properties are highly important in drug discovery with binding affinity being crucial for selecting hit and lead candidates. Existing machine learning models often lack speed for large-scale screening or lack generalizability. This thesis develops faster models for binding affinity prediction, surpassing previous voxel-based models. It compares 2D and 3D models through extensive benchmarks, highlighting scenarios where simpler 2D models outperform complex 3D models and showing how neural networks improve with supervised and unsupervised pretraining. The work also shows how combining 2D and 3D models yields state-of-the-art results in active learning. To address the difficult interpretability of neural network predictions, a new application is introduced to identify key contributing areas of the input space. Additionally, correct protonation states are essential for preparing molecular libraries. The thesis extends 3D graph-based models for micro-pKa estimation, presenting a new model and application that is more robust to diverse chemical compounds than existing methods.
Les propietats moleculars són molt importants en el descobriment de fàrmacs, on l’afinitat d’unió és crucial per seleccionar candidats potencials i caps de sèrie. Els models d’aprenentatge automàtic existents sovint els hi falta velocitat suficient per a cribatges de gran escala o generalitzabilitat. Aquesta tesi desenvolupa models més ràpids per a la predicció d’afinitat d’unió, superant els models anteriors basats en vòxels. La tesi compara models 2D i 3D a través de d’extenses dades de referència, remarcant escenaris on models 2D més simples obtenen millors resultats que models 3D més complexes i ensenyant com les xarxes neuronals milloren amb pre-entrenaments supervisats i no supervisats. El treball també mostra com la combinació de models 2D i 3D produeix resultats punters en aprenentatge actiu. Per abordar la difícil interpretabilitat de les prediccions de les xarxes neuronals, s’introdueix una nova aplicació per identificar les àrees clau que contribueixen a l’espai d’entrada. Addicionalment, la correcta protonació de les molecules és essencial per a la preparació de llibreries moleculars. La tesi estén els models 3D basats en grafs per a l’estimació de micro-pKa, presentat un nou model i aplicació més robust envers la diversitat química dels compostos que els mètodes actuals.
Les propietats moleculars són molt importants en el descobriment de fàrmacs, on l’afinitat d’unió és crucial per seleccionar candidats potencials i caps de sèrie. Els models d’aprenentatge automàtic existents sovint els hi falta velocitat suficient per a cribatges de gran escala o generalitzabilitat. Aquesta tesi desenvolupa models més ràpids per a la predicció d’afinitat d’unió, superant els models anteriors basats en vòxels. La tesi compara models 2D i 3D a través de d’extenses dades de referència, remarcant escenaris on models 2D més simples obtenen millors resultats que models 3D més complexes i ensenyant com les xarxes neuronals milloren amb pre-entrenaments supervisats i no supervisats. El treball també mostra com la combinació de models 2D i 3D produeix resultats punters en aprenentatge actiu. Per abordar la difícil interpretabilitat de les prediccions de les xarxes neuronals, s’introdueix una nova aplicació per identificar les àrees clau que contribueixen a l’espai d’entrada. Addicionalment, la correcta protonació de les molecules és essencial per a la preparació de llibreries moleculars. La tesi estén els models 3D basats en grafs per a l’estimació de micro-pKa, presentat un nou model i aplicació més robust envers la diversitat química dels compostos que els mètodes actuals.
Keywords
Machine learning, Active learning, Binding affinity, Acid-base dissociation constant, Interpretability, Aprendizaje automático, Aprendizaje activo, Afinidad de unión, Interpretabilidad, Constante de disociación ácido-base
Subjects
577 - Biochemistry. Molecular biology. Biophysics
Publisher
Universitat Pompeu Fabra






