Creation and visualization of a database regarding diversity and distribution of proteorhodopsin-containing bacteria across the whole ocean
Creation and visualization of a database regarding diversity and distribution of proteorhodopsin-containing bacteria across the whole ocean
Enllaç permanent
Descripció
Resum
Des de l’any 2000, milers de proteorhodopsines (PR) s’han identificat en procariotes, ampliant el seu rang filo-genètic, distribució ambiental i diversitat sequencial. La creació d’una revisada base de dades (PR_DB) amb al voltant de 13.000 PR procedents de tot el mòn ha sigut la base d’aquest projecte. Les dades foren categoritzades en més de 100 paràmetres. Una interfaç BLAST també fou implementada amb la finalitat de comparar noves sequències amb les ja anotades. En conclusió, oferim el primer servidor web implementant una base de dades de PR, un recurs valiós per a la comunitat científica amb l’interès d’explorar la diversitat i distribució d’aquestes sequències en una escala global i descubrir noves i potencials proteorhodopsines.
Desde el año 2000, miles de proteorhodopsinas (PR) han sido identificadas en procariotas, expandiendo su rango filo-genético, distribución ambiental y diversidad secuencial. La creación de una revisada base de datos (PR_DB) con alrededor de 13.000 PR provenientes de todo el mundo ha sido la base de este proyecto. Los datos fueron categorizados en más de 100 parámetros. Una interfaz BLAST tambien ha sido implementada con el fin de comparar secuencias nuevas con las ya anotadas. En definitiva, ofrecemos el primer servidor web con una base de datos de PR, un recurso valioso para la comunidad científica con el interés de explorar la diversidad y distribución de estas secuencias en una escala global y descubrir nuevas y potenciales proteorhosopsinas.
Since 2000, thousands of proteorhodopsins (PR) have been identified from marine prokaryotes expanding their known phylogenetic range, environmental distribution and sequence diversity. The creation of a curated Proteorhodopsin Database (PR_DB) consisting of around 13.000 PR sequences worldwide has been the base of this project. All the collected data was organized by over 100 parameters to perform the comparisons as much detailed as possible. Additionally, a BLAST search against this new Database was implemented too, allowing comparisons with outsider sequences. In summary, we offer the first integrated Marine Proteorhodopsins Database as a web server, a valuable resource for the scientific community with interest to explore the diversity and distribution of PR at global scales as well as to uncover potential novel proteorhosopsins.Descripció
Treball de fi de grau en Bioinformàtica. Curs 2018-2019
Tutors: Isabel Ferrera, Silvia G. Acinas y Pablo Sánchez