Developing a variant calling pipeline for ribosomal DNA
Developing a variant calling pipeline for ribosomal DNA
Enllaç permanent
Descripció
Resum
L'ADN ribosòmic (rADN) és vital degut al seu paper en la traducció de proteïnes, però l'alt contingut de GC i la repetició de les regions on estan codificats fan que sigui difícil seqüenciar-lo i analitzar-lo. En aquest estudi s'ha desenvolupat un preocés per analitzar la variabilitat de l'rADN, provat amb lectures simulades a causa de la disponibilitat limitada de dades d'rADN. Amb aquest procés s'ha aconseguit una alta puntuació F1 de 0.9358 validada amb lectures de seqüenciació del genoma complet de l'assemblatge T2T-CHM13.
El ADN ribosómico (rADN) es vital debido a su papel en la traducción de proteínas; sin embargo, el alto contenido de GC y la repetitividad de las regiones donde están codificados hacen que sea difícil secuenciarlas y analizarlas. En este estudio se ha desarrollado una procedimiento para analizar la variabilidad del rADN, probada con lecturas simuladas debido a la limitada disponibilidad de datos de rADN. Con el procedimiento se ha logrado una alta puntuación F1 de 0.9358 validada con lecturas de secuenciación del genoma completo del ensamblaje T2T-CHM13.
Ribosomal DNA (rDNA) is vital due to its role in protein translation, however, the high GC content and repetitiveness of the regions where they are encoded make it difficult to sequence and analyze. This study developed a pipeline to analyze rDNA variability, tested on simulated reads due to limited rDNA data. The pipeline achieved a high F1 score of 0.9358 and was validated with whole genome sequencing reads from the T2T-CHM13Descripció
Treball de fi de grau en Bioinformàtica. Curs 2023-2024
Tutors: José Miguel Ramírez and Marta Melé