Modular approaches and applications in reinforcement learning development and validation of next-generation frameworks

Bou Hernández, AlbertDe Fabritiis, GianniUniversitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions2025-04-122025-04-122025-04-112025-01-272027-01-27http://hdl.handle.net/10230/70136Reinforcement learning (RL) provides a unique framework for addressing sequential decision-making problems. Despite the numerous software frameworks proposed to accelerate the development of new algorithms and applications, RL researchers and practitioners often still rely on custom code. This thesis identifies and addresses some core issues contributing to this trend. In the first part, we propose a modular approach for defining distributed RL schemes using basic, reusable building blocks. In the second part, we contribute to the creation of TorchRL, the official PyTorch domain library for general decision-making. TorchRL is designed to be efficient, scalable, and broadly applicable. Finally, we leverage and validate TorchRL by developing ACEGEN, a library for language-based generative drug discovery, and use it to explore new solutions in this field.Programa de Doctorat en Tecnologies de la Informació i les Comunicacions134 p.application/pdfengADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.info:eu-repo/semantics/embargoedAccessModular approaches and applications in reinforcement learning development and validation of next-generation frameworksinfo:eu-repo/semantics/doctoralThesisDeep reinforcement learningDecision-making algorithmsPython librariesPyTorchTorchRLDrug design62