Grau en Enginyeria Matemàtica en Ciència de Dades. Treballs de Fi de Grau
http://hdl.handle.net/10230/48882
2024-03-29T11:39:38ZImplementation of a privacy preserving KNN algorithm based on FHE
http://hdl.handle.net/10230/58031
Implementation of a privacy preserving KNN algorithm based on FHE
Viladot Saló, Albert
Fully homomorphic encryption (FHE) is an encryption technique that allows computation to be performed on encrypted data without the need to decrypt it first. This has the
potential to revolutionize data security and privacy, and ongoing research is focused on
improving its efficiency and practicability.
One limitation of FHE schemes is that, typically, they only support additions and multiplications. More complex operations, such as real number comparison, require careful
design of new algorithms. In this project, we explore a recent approach based on polynomial composition for comparing two real numbers in a homomorphically encrypted
setting. We study how this method can be used to sort an array of real numbers using FHE. We then apply these concepts to design and implement a fully homomorphic
version of the popular Machine Learning algorithm known as k-nearest neighbours
(KNN).
To implement the FHE KNN algorithm, we use the CKKS scheme and the OpenFHE
library, an open-source software library developed in C++. Finally, we analyse the
computational performance of our implementation to evaluate its efficiency, depending on the dataset size and the number of neighbours. Our results indicate that the
time complexity increases exponentially with the dataset size. Reasonable computation times are achievable for small datasets, with up to 16 training samples.; El xifratge totalment homomòrfic (FHE) és una tècnica d’encriptació que permet realitzar càlculs sobre dades encriptades sense necessitat de desencriptar-les prèviament. Això té el potencial de revolucionar la seguretat i privacitat de les dades, i la investigació en curs es centra en millorar la seva eficiència i practicabilitat. Una limitació dels esquemes basats en FHE és que, generalment, només permeten sumes i multiplicacions. Operacions mes complexes, com la comparació de nombres reals, requereixen un disseny meticulós de nous algoritmes. En aquest projecte, explorem una proposta recent basada en la composició de polinomis per comparar dos nombres reals en un entorn de xifratge homomòrfic. Estudiem com aquest mètode pot ser utilitzat per ordenar un conjunt de nombres reals utilitzant FHE. A continuació, apliquem aquests conceptes per dissenyar i implementar una versió totalment homomòrfica de l’algorisme popular d’aprenentatge automàtic conegut com a knearest neighbours (KNN). Per implementar l’algorisme de KNN amb FHE, utilitzem l’esquema CKKS i la llibreria OpenFHE, una llibreria de programari de codi obert desenvolupada en C++. Finalment, analitzem el rendiment computacional de la nostra implementació per avaluar-ne l’eficiència, en funció de la mida del conjunt de dades i del nombre de veïns. Els nostres resultats indiquen que la complexitat temporal augmenta exponencialment amb la mida del conjunt de dades. Obtenim temps de càlcul raonables per a conjunts de dades petits, amb fins a 16 mostres d’entrenament.; El cifrado totalmente homomórfico (FHE) es una técnica de encriptación que permite
realizar cálculos sobre datos encriptados sin necesidad de desencriptarlos previamente.
Esto tiene el potencial de revolucionar la seguridad y privacidad de los datos, y la
investigación en curso se centra en mejorar su eficiencia y practicabilidad.
Una limitación de los esquemas basados en FHE es que, generalmente, solo permiten sumas y multiplicaciones. Operaciones más complejas, como la comparación de dos números reales, requieren un diseño meticuloso de nuevos algoritmos. En este proyecto, exploramos una propuesta reciente basada en la composición de polinomios para comparar dos números reales en un entorno de cifrado homomórfico. Estudiamos como este método puede ser usado para ordenar un conjunto de números reales usando FHE. A continuación, aplicamos estos conceptos para diseñar e implementar una versión totalmente homomórfica del popular algoritmo de aprendizaje automático conocido como knearest neighbours (KNN).
Para implementar el algoritmo de KNN con FHE, utilizamos el esquema CKKS y la
librería OpenFHE, una librería de software de código abierto desarrollada en C++. Finalmente, analizamos el rendimiento computacional de nuestra implementación para evaluar su eficiencia, en función del tamaño del conjunto de datos y del número de vecinos. Nuestros resultados indican que la complejidad temporal aumenta exponencialmente con el tamaño del conjunto de datos. Obtenemos tiempos de cálculo razonables para conjuntos de datos pequeños, con hasta 16 muestras de entrenamiento.
Treball de fi de grau del Grau en Enginyeria Matemàtica en Ciència de Dades. Tutor: Sergi Rovira Cisterna
2023-10-03T00:00:00ZPredicting zippers: the power of ML in the small textile companyies
http://hdl.handle.net/10230/58028
Predicting zippers: the power of ML in the small textile companyies
Dalmau Clotet, Júlia
The textile industry has begun to embrace algorithm and Machine Learning (ML)
predictions over the past decade to improve their sales performance and overall
efficiency. In this project, ML models are applied in a zipper dataset to try to find an
accurate prediction about future sales trends for a small company called Kreband.
Furthermore, an analysis of the zippers features is applied to see which is the impact in
the ML model and how the company can reduce costs and gain efficiency to compete
against the multinational companies.; Durant la darrera dècada, la indústria tèxtil ha començat a descobrir els algorismes i les prediccions de l’aprenentatge automàtic per millorar el seu rendiment. En aquest projecte, s’apliquen diferents models d’aprenentatge automàtic a un conjunt de dades de per tal de trobar la predicció més precisa possible sobre les vendes de cremalleres per l’empresa Kreband. A més, s’usa un anàlisi de les característiques de cada tipus de cremalleres per veure quin és l’impacte en el model i així ajudar a l’empresa a reduir les despeses i guanyar eficiència per poder competir davant les grans companyies multinacionals.; Durante la última década, la industria textil ha empezado a descubrir los algoritmos y
predicciones del aprendizaje automático para mejorar su rendimiento. En este proyecto,
se aplican diferentes modelos de aprendizaje automático a un conjunto de datos para
encontrar la predicción más precisa sobre las ventas de cremalleras por la empresa
Kreband. Además, se usa un análisis de las características de cada tipo de cremalleras
para ver cuál es el impacto en el modelo y así ayudar a la empresa a reducir los gastos y
ganar eficiencia para poder competir frente a las grandes compañías multinacionales.
Treball de fi de grau del Grau en Enginyeria Matemàtica en Ciència de Dades.
Tutor: Miguel Ángel Cordobés Aranda
2023-10-03T00:00:00ZAplicación de técnicas computacionales de extracción y análisis de datos para entender mejor la ciendia ciudadana
http://hdl.handle.net/10230/54792
Aplicación de técnicas computacionales de extracción y análisis de datos para entender mejor la ciendia ciudadana
Martínez Almansa, Mara
La ciencia ciudadana es un nuevo proceso participativo que se utiliza en ciencia que
permite a cualquier ciudadano participar en proyectos científicos. CS Track es un
proyecto Europeo H2020 que tiene como objetivo ampliar el conocimiento sobre este
modelo de participación ciudadana en ciencia.
Este trabajo tiene como objetivo principal extraer, automáticamente, información de las
descripciones de proyectos de ciencia ciudadana almacenados en la base de datos de CS
Track. Para ello se elaborarán diversos algoritmos donde se apliquen técnicas de
extracción de la información. Posteriormente se procederá al análisis y visualización de
los resultados. Gracias a este trabajo, CS Track podrá extraer y clasificar automáticamente
la información almacenada, además de facilitar los futuros estudios y análisis con mayor
profundidad.; La ciència ciutadana és un nou procés participatiu que s’utilitza en ciència que permet a
qualsevol ciutadà participar en projectes científics. CS Track és un projecte Europeu
H2020 que té com objectiu ampliar el coneixement sobre aquest model de participació
ciutadana en ciència.
Aquest treball té com objectiu principal extreure, automàticament, informació a partir de
les descripcions de projectes de ciència ciutadana emmagatzemats a la base de dades de
CS Track. Per això es construiran diversos algoritmes on s’apliquin tècniques d’extracció
de la informació. Posteriorment es procedirà a l’anàlisis i visualització dels resultats.
Gràcies a aquest treball, CS Track podrà extraure i classificar automàticament la
informació emmagatzemada, a més de facilitar els futurs estudis i anàlisis amb major
profunditat.; Citizen science is a new participatory process used in science that allows any citizen to
participate in scientific projects. CS Track is a European H2020 project that aims to
expand knowledge about this model of citizen participation in science.
The main objective of this work is to automatically extract information from the
descriptions of citizen science projects stored in the CS Track database. For this, various
algorithms will be developed where information extraction techniques are applied.
5
Subsequently, the analysis and visualization of the results will be carried out. Thanks to
this work, CS Track will be able to automatically extract and classify the stored
information, in addition to facilitating future studies and analysis in greater depth.
Tutores: Patricia Santos Rodríguez, Miriam Calvera; Treball de fi de grau en Enginyeria Matemàtica en Ciència de Dades
2022-01-01T00:00:00ZL’algoritme Apriori i el bàsquet: utilitzant Machine Learning per a identificar els conjunts de jugadors més eficients i les seves relacions
http://hdl.handle.net/10230/54494
L’algoritme Apriori i el bàsquet: utilitzant Machine Learning per a identificar els conjunts de jugadors més eficients i les seves relacions
Villaró Cañizal, Miquel
Mesurar l’impacte que té un jugador de bàsquet en el joc del seu equip és una de les grans
incògnites en l’àmbit de l’analítica de dades de l’esport. En aquest treball es tracta la
utilització de Machine Learning a través de l'Algoritme Apriori aplicat al FC Barcelona de
bàsquet en competició d’Eurolliga per a identificar els conjunts de jugadors més eficients i
les relacions entre ells. A més a més, també s’atribueix una estadística que mesura l’impacte
dels jugadors en cada fase del joc i s’estableix un model predictiu sobre l’actuació d’aquests
en la Final a 4 de la temporada 2021-2022.; Measuring the impact of a basketball player on his/her team is one of the most burdensome
unknowns in the sport’s data analytics world. In this project Machine Learning is used
through the Apriori Algorithm applied to FC Barcelona’s basketball team to identify the most
efficient sets of players and the relationship between them. Furthermore, a statistic is
assigned to measure the impact of the players in each game phase and a predictive model is
established to forecast their performance in the Final 4 of the 2021-2022 season.; Medir el impacto que tiene un jugador de baloncesto en su equipo es una de las mayores
incógnitas en el ámbito de analítica de datos del deporte. En este proyecto se trata el uso de
Machine Learning mediante el Algoritmo Apriori aplicado al FC Barcelona de baloncesto
para identificar los conjuntos de jugadores más eficientes y las relaciones entre ellos.
Además, se atribuye una estadística que calibra el impacto de los jugadores en cada fase
del juego y se establece un modelo predictivo sobre la actuación de los mismos en la Final a
4 de la temporada 2021-2022.
Tutor: Miguel Ángel Cordobés Aranda; Treball de fi de grau en Enginyeria Matemàtica en Ciència de Dades
2022-01-01T00:00:00Z