Detecció d'anomalies a partir d'un rànquing creat amb mètodes de machine learning no supervisats

Enllaç permanent

Descripció

  • Resum

    Els centres d’empresa de Caixabank són les oficines on els clients principals són empreses. En l’actualitat, el risc de patir activitats de frau, sobretot a una entitat com els bancs, ha crescut de forma desmesurada. Aquesta situació ve donada per l’evolució de les noves tecnologies i per les facilitats de provocar nous casos de frau, suposen un elevat risc per l‘entitat i és primordial detectar-los el més aviat possible per evitar grans pèrdues. El departament d’Auditoria Interna és l’encarregat de treballar en aquestes tasques per analitzar les dades de risc, creant mètodes de detecció i prevenció. En aquest projecte es crearà un rànquing pels centres d’empresa, amb la finalitat de detectar anomalies i seleccionar aquells centres més susceptibles de presentar un risc per l’entitat, tant de frau com de males pràctiques. Es requereix aquest rànquing perquè hi ha més centres d’empreses que auditors, i per tant, cal facilitar el rang de centres amb més probabilitat de cometre tant frau com males pràctiques, i així prioritzar-ne la revisió. La novetat que presenta és la inclusió de tècniques de machine learning per agilitzar el procés i optimitzar-lo com a projecte de transformació digital. Aquest mètode ha permès detectar les anomalies de forma satisfactòria utilitzant algorismes no supervisats i representacions de les dades en forma de grafs bipartits.
    Los centros de empresa de Caixabank son las oficinas donde los clientes principales son empresas. En la actualidad, el riesgo de sufrir actividades de fraude, sobre todo en una entidad como los bancos, ha crecido de forma desmesurada. Esta situación viene dada por la evolución de las nuevas tecnologías y por las facilidades de provocar nuevos casos de fraude. Suponen un elevado riesgo para la entidad y es primordial detectarlos lo antes posible para evitar grandes pérdidas. El departamento de Auditoría Interna es el encargado de trabajar en estas tareas para analizar los datos de riesgo, creando métodos de detección y prevención. En este proyecto se creará un ranking por los centros de empresa, para detectar anomalías y seleccionar aquellos centros más susceptibles a presentar un riesgo para la entidad, tanto de fraude como de malas prácticas. Se requiere este ranking porque hay más centros de empresas que auditores, por lo tanto, hay que facilitar el rango de centros con más probabilidad de cometer tanto fraude como malas prácticas , y así priorizar su revisión. La novedad que presenta este es la inclusión de técnicas de machine learning para agilizar el proceso y optimizarlo como proyecto de transformación digital. Este método ha permitido detectar las anomalías de forma satisfactoria utilizando algoritmos no supervisados y representaciones de los datos en forma de grafos bipartitos.
    Caixabank's business centers are the offices where the main customers are companies. Nowadays, the risk of fraud, especially in an entity such as a bank, has increased exponentially. This situation is due to the evolution of new technologies and the ease of producing new cases of fraud. They pose a high risk to the entity and it is essential to detect them as soon as possible to avoid large losses. The Internal Audit Department is the responsible for working on these tasks to analyze risk data, creating detection and prevention methods. In this project a ranking is created for business centers, to detect anomalies and select those centers most likely to present a risk to the entity, for fraud and bad practices. This ranking is required because there are more business centers than auditors, and therefore the range of centers most likely to be suspicious needs to be facilitated, thus prioritizing its review. The present novelty of that, is the inclusion of machine learning techniques to speed up the process and optimize it as a digital transformation project. This method has made it possible to detect anomalies satisfactorily using unsupervised algorithms and representations of data in the form of bipartite graphs.
  • Descripció

    Treball de fi de grau en Sistemes Audiovisuals
    Tutors: Xavier Binefa i Ricardo Fernández
  • Mostra el registre complet