Characterization of inter/intra-individual and inter-tissue genetic variation in human ribosomal DNA genes
Characterization of inter/intra-individual and inter-tissue genetic variation in human ribosomal DNA genes
Enllaç permanent
Descripció
Resum
El ribosoma és crucial per a la síntesi de proteïnes i les variants genètiques dels gens ribosomals poden causar diverses malalties. L'anàlisi dels gens ribosomals ha estat un repte a causa de la seva ubicació en regions cromosòmiques repetitives. La publicació del genoma humà T2T-CHM13 proporciona una referència completa amb els gens ribosomals caracteritzats en les regions centromèriques. Hem desenvolupat un mètode computacional utilitzant aquesta referència per identificar amb precisió les variants d'DNA ribosomal (rDNA) a partir de dades aparellades de WGS i RNAseq. En l'anàlisi de la referència hem detectat 120 variants d'rDNA, de les quals 71 les podem detectar en dades de WGS i 17 en dades de RNAseq. L'aplicació del mètode computacional a 48 línies cel·lulars humanes ha validat la seva eficàcia. Aquest estudi contribueix a entendre la variabilitat de l'rRNA (RNA ribosomal) i prepara les bases per a una exploració posterior en la investigació de la transcriptòmica.
El ribosoma es crucial para la síntesis de proteínas y las variantes genéticas en los genes ribosómicos pueden causar diversas enfermedades. El análisis de genes ribosómicos ha sido un desafío debido a su ubicación en regiones cromosómicas repetitivas. La publicación del genoma humano completo proporciona por primera vez una referencia completa con genes ribosómicos que se ubican en los centromeros. En este trabajo desarrollamos un diagrama de trabajo utilizando esta referencia para identificar con precisión las variantes de ARN ribosómico a partir de datos WGS y RNAseq obtenidos de las mismas muestras. De las 120 variantes en el genoma de referencia, podemos detectar con 71 en datos WGS y 17 con datos de RNAseq. Además hemos usado este metodo para identificar variantes nuevas en 48 líneas celulares humanas. Este estudio contribuye a comprender la variabilidad del ARNr y sienta las bases para una mayor exploración en la investigación transcriptómica.
The ribosome is crucial for protein synthesis and genetic variants in ribosomal genes can cause various diseases. Analyzing ribosomal genes have been challenging due to their location in repetitive chromosome regions. The release of T2T-CHM13 human genome provides comprehensive reference with characterized ribosomal genes in centromeric regions. We developed a computational pipeline using this reference to accurately identify ribosomal RNA variants from matched WGS and RNAseq data.Benchmark analysis identified 120 variants within the different rDNA operons of T2T-CHM13 genome and found 71 out of the 120 to be detectable in WGS data and 17 in RNAseq data . Applying the pipeline to 48 cell lines validated its effectiveness. This study contributes to understanding rRNA gene expression variability and sets the stage for further exploration in transcriptomics research.Descripció
Treball de fi de grau en Bioinformàtica. Curs 2022-2023
Tutor: Marta Mele