TEmerics: a pipeline for the identification and analysis of chimeric gene-TE transcripts

dc.contributor.authorGarcia Andrés, Albert
dc.date.accessioned2024-12-04T10:49:41Z
dc.date.available2024-12-04T10:49:41Z
dc.date.issued2024-06-18
dc.descriptionTreball de fi de grau en Bioinformàtica. Curs 2023-2024ca
dc.descriptionTutora: Josefa Gonzàlezca
dc.description.abstractLa diversificació del transcriptoma impulsa la diversitat del proteoma entre espècies, amb l’splicing alternatiu creant isoformes proteiques específiques per tipus cel·lular per al manteniment de l’homeòstasi de l’organisme. Les insercions d’elements transposables (TE) generen quimeres gen-TE, però identificar aquests transcrits és un repte a causa de la limitada escalabilitat de les pipelines existents. Aquest treball presenta TEmerics, una pipeline Snakemake per detectar i analitzar transcrits quimèrics gen-TE. La seva avaluació comparativa amb ChimeraTE, una eina similar, va ser provada per a rendiment i precisió. L’anàlisi de dades de RNA-seq de sis soques de Drosophila melanogaster en condicions d’estrès i control va revelar que més del 10% de les quimeres gen-TE apareixen només sota estrès. També es van identificar millores futures per a TEmerics.ca
dc.description.abstractLa diversificación del transcriptoma impulsa la diversidad del proteoma entre especies, con el splicing alternativo creando isoformas proteicas específicas para cada tipo celular para el mantenimiento de la homeostasis del organismo. Las inserciones de elementos transponibles (TE) generan quimeras gen-TE, pero identificar estos transcritos es un desafío debido a la limitada escalabilidad de las pipelines existentes. Este trabajo presenta TEmerics, una pipeline de Snakemake para detectar y analizar transcritos quiméricos gen-TE. La evaluación comparativa con ChimeraTE, una herramienta similar, se probó en cuanto a rendimiento y precisión. El análisis de datos de RNA-seq de seis cepas de Drosophila melanogaster en condiciones de estrés y control reveló que más del 10% de las quimeras gen-TE aparecen solo bajo estrés. También se identificaron mejoras futuras para TEmerics.es
dc.description.abstractTranscriptome diversification drives proteome diversity across species, with alternative splicing creating cell-type-specific protein isoforms for organism homeostasis. Transposable element (TE) insertions generate gene-TE chimeras, but identifying these transcripts is challenging due to limited scalability in existing pipelines. This work introduces TEmerics, a Snakemake pipeline for detecting and analyzing chimeric gene-TE transcripts. Benchmarking against ChimeraTE, a similar tool, was tested for performance and accuracy. Analysis of RNA-seq data from six Drosophila melanogaster strains under stress and control conditions revealed that over 10% of gene-TE chimeras appear only under stress. Future improvements for TEmerics were also identified.en
dc.format.mimetypeapplication/pdf*
dc.identifier.urihttp://hdl.handle.net/10230/68915
dc.language.isoengca
dc.rightsThis is an Open Access article distributed under the terms of the Creative Commons Attribution-NonCommercial-NoDerivs 3.0 licenseca
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessca
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/ca
dc.subject.keywordTransposable elementsen
dc.subject.keywordChimerasen
dc.subject.keywordAlternative splicingen
dc.subject.keywordPipelineen
dc.subject.keywordBenchmarkingen
dc.subject.keywordStressen
dc.subject.otherTreball de fi de grau – Curs 2023-2024ca
dc.titleTEmerics: a pipeline for the identification and analysis of chimeric gene-TE transcriptsca
dc.typeinfo:eu-repo/semantics/bachelorThesisca

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TFGBDBI24Garcia_Teme.pdf
Size:
644.02 KB
Format:
Adobe Portable Document Format
Description:

License

Rights