This thesis investigates the integration and analysis of OMICs data to enhance in silico modelling of real-world patients, with a special focus on prostate cancer. By leveraging publicly available transcriptomics data, this research addresses the challenges of integrating diverse datasets, which is crucial for improving the precision and reliability of disease models. The study is motivated by the rapid advancements in OMICs technologies, which have generated extensive datasets with the potential ...
This thesis investigates the integration and analysis of OMICs data to enhance in silico modelling of real-world patients, with a special focus on prostate cancer. By leveraging publicly available transcriptomics data, this research addresses the challenges of integrating diverse datasets, which is crucial for improving the precision and reliability of disease models. The study is motivated by the rapid advancements in OMICs technologies, which have generated extensive datasets with the potential to deepen disease understanding and improve patient care. However, the effective integration of this data to yield meaningful insights remains a significant challenge.
To address this, the research focuses on developing in silico models that integrate Real-World Data (RWD) and OMICs, with a particular emphasis on transcriptomics (specifically microarrays). A novel post-processing technique, MicroArray Cross-plAtfoRm pOst-prOcessiNg (MACAROON), is introduced, which enhances data precision by converting random errors into systematic biases across a large-scale repository of patient data. This repository, which combines gene expression data with clinical and demographic information, enables the creation of customised patient datasets, thereby improving statistical power and the ability to derive reliable biological insights across different patient groups.
The practical application of this repository is demonstrated through the identification of novel biomarker candidates for high-grade prostate cancer. By employing Machine Learning (ML) techniques on patient-derived datasets, this research proposes a list of new candidates that demonstrate a strong ability to reduce false positives, while maintaining aspects of performance comparable to existing biomarkers. These biomarkers have the potential to significantly refine prostate cancer diagnostics and inform more effective patient management strategies.
In conclusion, this thesis contributes to the field of precision medicine by advancing the integration of RWD and OMICs data into clinically relevant models. The findings presented offer new pathways for improving prostate cancer diagnosis and treatment, underscoring the importance of data-driven approaches in modern healthcare.
+
Aquesta tesi investiga la integració i l’anàlisi de dades òmiques per millorar la modelització in silico de pacients del món real, amb una especial atenció en el càncer de pròstata. Mitjançant l’ús de dades públiques de transcriptòmica, aquesta recerca aborda els desafiaments d’integrar conjunts de dades diversos, crucial per millorar la precisió i la fiabilitat dels models de malalties. L’estudi es motiva pels ràpids avenços en les tecnologies òmiques, que han generat conjunts de dades extensos ...
Aquesta tesi investiga la integració i l’anàlisi de dades òmiques per millorar la modelització in silico de pacients del món real, amb una especial atenció en el càncer de pròstata. Mitjançant l’ús de dades públiques de transcriptòmica, aquesta recerca aborda els desafiaments d’integrar conjunts de dades diversos, crucial per millorar la precisió i la fiabilitat dels models de malalties. L’estudi es motiva pels ràpids avenços en les tecnologies òmiques, que han generat conjunts de dades extensos amb el potencial d’aprofundir en la comprensió de les malalties i millorar l’atenció als pacients. No obstant això, la integració efectiva d’aquestes dades per obtenir informació significativa continua essent un repte important.
Per abordar aquest repte, la recerca es centra en el desenvolupament de models in silico que integren Real-World Data (RWD) i dades òmiques, amb un èmfasi particular en la transcriptòmica (concretament en microarrays). Es desenvolupa una nova tècnica de post-processament, MACAROON, que millora la precisió de les dades convertint errors aleatoris en biaixos sistemàtics. A més es crea un repositori que combina dades d’expressió gènica amb informació clínica i demogràfica RWD. Això permet la creació de conjunts de dades personalitzats de pacients, millorant així la potència estadística i la capacitat de derivar informació biològica fiable en diferents tipus de pacients.
L’aplicació pràctica d’aquest repositori es demostra mitjançant la identificació de nous candidats a biomarcadors per al càncer de pròstata en fase avançada. Mitjançant tècniques d’aprenentatge automàtic en conjunts de dades derivades de pacients, proposem una llista de nous candidats que demostren una gran capacitat per reduir falsos positius, mantenint la resta de mètriques comparables als biomarcadors existents. Aquests biomarcadors tenen el potencial de optimitzar significativament el diagnòstic del càncer de pròstata i millorar les estratègies de gestió de pacients actuals.
En conclusió, aquesta tesi contribueix al camp de la medicina de precisió mitjançant de la integració de dades RWD i òmiques en models clínicament rellevants. Els resultats presentats ofereixen noves vies per millorar el diagnòstic i el tractament del càncer de pròstata, subratllant la importància dels enfocaments basats en dades en la sanitat moderna.
+
Programa de Doctorat en Biomedicina