Marimon Fernández, Guillem2024-04-262024-04-262023-06-21http://hdl.handle.net/10230/59917Treball de fi de grau en Bioinformàtica. Curs 2022-2023Tutor: Ramon MassanaSAGs seqüenciats amb Illumina pateixen diverses limitacions. Millorar la precisió i la profunditat de la informació obtinguda dels SAGs permetrà avançar en la comprensió de les comunitats microbiològiques en entorns diversos. Proposem l'ús de dades metagenòmiques de la mateixa mostra ambiental on es van recollir els SAGs per millorar la qualitat d'aquests. Proposem dues metodologies peraquesta millora: per similitud i per agrupació. Ambdós metodologies aconseguim una millora del 2.3% en la completitud de BUSCO i del 14% en mida del genoma.SAGs secuenciados con Illumina sufren de diversas limitaciones. Mejorar la precisión y la profundidad de la información obtenida de los SAGs permitirá avanzar en la comprensión de las comunidades microbiológicas en diferentes entornos. Proponemos el uso de datos metagenómicos de la misma muestra ambiental donde se recolectaron los SAGs para mejorar la calidad de estos. Proponemos dos metodologías para esta mejora: por similitud y por agrupación. Con ambas metodologías logramos una mejora del 2.3% en la completitud de BUSCO y del 14% en medida del genoma.SAGs sequenced with Illumina suffer from several limitations. Enhancing the accuracy and depth of information obtained from SAGs will lead to the advancing of our understanding of microbial communities in diverse environments. We propose the use of metagenomic data from the same environmental sample where SAGs were collected to improve the quality of these last. We propose two pipelines with two different improvement approaches: by similarity, and by binning. With both approaches, we managed to obtain a 3% improvement in BUSCO completeness and 14% improvement in genome size.application/pdfengThis is an Open Access article distributed under the terms of the Creative Commons Attribution-NonCommercial-NoDerivs 3.0 licenseTreball de fi de grau – Curs 2022-2023Use of metagenomic data for the improvement of single-cell amplified genomes (SAGs) from marine pico-eukaryote flagellatesinfo:eu-repo/semantics/bachelorThesisSAGsMetagenomaMilloraMejoraMetagenomicsImprovementinfo:eu-repo/semantics/openAccess