Risk assessment in complex data settings: algorithmic fairness and causal inference
Mostra el registre complet Registre parcial de l'ítem
- dc.contributor.author Karimi-Haghighi, Marzieh
- dc.contributor.other Castillo, Carlos
- dc.contributor.other Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
- dc.date.accessioned 2024-03-16T02:34:32Z
- dc.date.available 2024-03-16T02:34:32Z
- dc.date.issued 2023-02-03T13:56:44Z
- dc.date.issued 2023-02-03T13:56:44Z
- dc.date.issued 2023-01-20
- dc.date.modified 2024-03-15T10:58:05Z
- dc.description.abstract We try to address some challenges in structured risk assessment tools in two application areas of recidivism risk in criminal justice and dropout risk in higher education domain. Using Machine Learning (ML) methods, we suggest a cost-benefit scenario to efficiently save time, expenses and staff in a data-driven assessment of violent recidivism risk. This leads to fewer evaluations in exchange for some small number of undetected changes. Importantly, we mitigate the model’s disparate impact in the rate of evaluation across some demographics. We obtain more accurate ML risk prediction models compared to the previous models and improve algorithmic fairness of the models across some sensitive groups in terms of error disparity and calibration. We determine the effect of a treatment on the outcome risk using statistical causal inference methods. We show that a reduction in university workload reduces dropout risk and conditional release can reduce general and violent recidivism risks.
- dc.description.abstract Intentamos abordar algunos desafíos en las herramientas estructuradas de evaluación de riesgos en dos áreas de aplicación de riesgo de reincidencia y riesgo de deserción universitaria. Usando métodos de ML, sugerimos un escenario de costo-beneficio para ahorrar tiempo, gastos y personal de manera eficiente en una evaluación basada en datos del riesgo de reincidencia violenta. Esto conduce a menos evaluaciones a cambio de una pequeña cantidad de cambios no detectados. Mitigamos impacto dispar del modelo en tasa de evaluación en algunos grupos demográficos. Obtenemos modelos de predicción de riesgo de ML más precisos en comparación con los modelos anteriores y mejoramos la equidad algorítmica de los modelos en algunos grupos sensibles en términos de disparidad de errores y calibración. Usando métodos estadísticos de inferencia causal, mostramos que una reducción en carga de trabajo universitaria reduce riesgo de deserción y liberación condicional puede reducir riesgos de reincidencia general y violenta.
- dc.description.abstract Programa de doctorat en Tecnologies de la Informació i les Comunicacions
- dc.format 200 p.
- dc.format application/pdf
- dc.identifier http://hdl.handle.net/10803/687573
- dc.identifier.uri http://hdl.handle.net/10230/55607
- dc.language.iso eng
- dc.publisher Universitat Pompeu Fabra
- dc.rights ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
- dc.rights info:eu-repo/semantics/openAccess
- dc.source TDX (Tesis Doctorals en Xarxa)
- dc.subject.keyword Risk assessment
- dc.subject.keyword Violent recidivism
- dc.subject.keyword General recidivism
- dc.subject.keyword University dropout
- dc.subject.keyword Machine learning
- dc.subject.keyword Algorithmic fairness
- dc.subject.keyword Causal inference
- dc.subject.keyword Conditional release
- dc.subject.keyword University credits
- dc.subject.keyword Average treatment effect
- dc.subject.keyword Evaluación de riesgos
- dc.subject.keyword Reincidencia violenta y general
- dc.subject.keyword Deserción universitaria
- dc.subject.keyword Aprendizaje automático
- dc.subject.keyword Equidad algorítmica
- dc.subject.keyword Inferencia causal
- dc.subject.keyword Liberación condicional
- dc.subject.keyword Créditos universitarios
- dc.subject.keyword 62
- dc.title Risk assessment in complex data settings: algorithmic fairness and causal inference
- dc.type info:eu-repo/semantics/doctoralThesis
- dc.type info:eu-repo/semantics/publishedVersion