TEmerics: a pipeline for the identification and analysis of chimeric gene-TE transcripts
Mostra el registre complet Registre parcial de l'ítem
- dc.contributor.author Garcia Andrés, Albert
- dc.date.accessioned 2024-12-04T10:49:41Z
- dc.date.available 2024-12-04T10:49:41Z
- dc.date.issued 2024-06-18
- dc.description Treball de fi de grau en Bioinformàtica. Curs 2023-2024ca
- dc.description Tutora: Josefa Gonzàlezca
- dc.description.abstract La diversificació del transcriptoma impulsa la diversitat del proteoma entre espècies, amb l’splicing alternatiu creant isoformes proteiques específiques per tipus cel·lular per al manteniment de l’homeòstasi de l’organisme. Les insercions d’elements transposables (TE) generen quimeres gen-TE, però identificar aquests transcrits és un repte a causa de la limitada escalabilitat de les pipelines existents. Aquest treball presenta TEmerics, una pipeline Snakemake per detectar i analitzar transcrits quimèrics gen-TE. La seva avaluació comparativa amb ChimeraTE, una eina similar, va ser provada per a rendiment i precisió. L’anàlisi de dades de RNA-seq de sis soques de Drosophila melanogaster en condicions d’estrès i control va revelar que més del 10% de les quimeres gen-TE apareixen només sota estrès. També es van identificar millores futures per a TEmerics.ca
- dc.description.abstract La diversificación del transcriptoma impulsa la diversidad del proteoma entre especies, con el splicing alternativo creando isoformas proteicas específicas para cada tipo celular para el mantenimiento de la homeostasis del organismo. Las inserciones de elementos transponibles (TE) generan quimeras gen-TE, pero identificar estos transcritos es un desafío debido a la limitada escalabilidad de las pipelines existentes. Este trabajo presenta TEmerics, una pipeline de Snakemake para detectar y analizar transcritos quiméricos gen-TE. La evaluación comparativa con ChimeraTE, una herramienta similar, se probó en cuanto a rendimiento y precisión. El análisis de datos de RNA-seq de seis cepas de Drosophila melanogaster en condiciones de estrés y control reveló que más del 10% de las quimeras gen-TE aparecen solo bajo estrés. También se identificaron mejoras futuras para TEmerics.es
- dc.description.abstract Transcriptome diversification drives proteome diversity across species, with alternative splicing creating cell-type-specific protein isoforms for organism homeostasis. Transposable element (TE) insertions generate gene-TE chimeras, but identifying these transcripts is challenging due to limited scalability in existing pipelines. This work introduces TEmerics, a Snakemake pipeline for detecting and analyzing chimeric gene-TE transcripts. Benchmarking against ChimeraTE, a similar tool, was tested for performance and accuracy. Analysis of RNA-seq data from six Drosophila melanogaster strains under stress and control conditions revealed that over 10% of gene-TE chimeras appear only under stress. Future improvements for TEmerics were also identified.en
- dc.format.mimetype application/pdf*
- dc.identifier.uri http://hdl.handle.net/10230/68915
- dc.language.iso engca
- dc.rights This is an Open Access article distributed under the terms of the Creative Commons Attribution-NonCommercial-NoDerivs 3.0 licenseca
- dc.rights.accessRights info:eu-repo/semantics/openAccessca
- dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/es/ca
- dc.subject.keyword Transposable elementsen
- dc.subject.keyword Chimerasen
- dc.subject.keyword Alternative splicingen
- dc.subject.keyword Pipelineen
- dc.subject.keyword Benchmarkingen
- dc.subject.keyword Stressen
- dc.subject.other Treball de fi de grau – Curs 2023-2024ca
- dc.title TEmerics: a pipeline for the identification and analysis of chimeric gene-TE transcriptsca
- dc.type info:eu-repo/semantics/bachelorThesisca