A computational approach to rhythm description - Audio features for the computation of rhythm periodicity functions and their use in tempo induction and music content processing
Mostra el registre complet Registre parcial de l'ítem
- dc.contributor.author Gouyon, Fabien
- dc.contributor.other Widmer, Gerhard
- dc.contributor.other Serra, Xavier
- dc.contributor.other Universitat Pompeu Fabra. Institut Universitari de l'Audiovisual
- dc.date.accessioned 2024-03-16T02:34:08Z
- dc.date.available 2024-03-16T02:34:08Z
- dc.date.issued 2011-04-12T16:35:14Z
- dc.date.issued 2006-02-16
- dc.date.issued 2005-11-30
- dc.date.issued 2006-02-16
- dc.date.modified 2024-03-15T10:58:02Z
- dc.description.abstract Aquesta dissertació tracta del ritme musical. Més exactamente, tracta de programes informàtics que extreuen automàticament descripcions rítmiques a partir de senyals musicals d'àudio.<br/>Presentem nous algorismes per a la inducció del tempo, la estimació del "tatum," la determinació del compàs, la estimació de "swing," transformacions de "swing" i la classificació d'estils de música de ball. Aquests algorismes processen directament gravacions digitalitzades de senyals acústiques de música. La base d'aquests algorismes son funcions de periodicitat rítmica: es a dir, funcions que mesuren la importància d'una pulsació rítmica en funció del període (o la freqüència) de la mateixa, calculades a partir d'atributs físics instantanis seleccionats per a posar en evidència aspectes rítmics del só. Aquests atributs es calculen amb una freqüència de mostreig constant sobre segments curts de la senyal d'àudio. <br/>Els nostres algorismes determinen el tempo i el "tatum" de música de diferents estils musicals, amb tempo constant, amb una precisió de més del 80% si no insistim en trobar el nivell mètric específic. Indentifiquen el compàs amb una precisió del 90%, si es coneixen nivells mètrics més ràpits. Classifiquen música de ball en 8 categories amb una precisió del 80% tenint en compte únicament aspectes rítmics de la música. Finalment, afegeixen (o substreuen) el "swing" de senyals musicals d'àudio de manera automàtica, conservant una alta qualitat de só.<br/>Des d'un punt de vista més general, aquesta dissertació contribueix de manera significativa al camp de la descripció computacional del ritme a) en proposar un entorn unificador d'analisi funcional; b) en revisar l'arquitectura de molts sistemes existent respecte els blocs funcionals d'aquest entorn; c) en organitzar la primera evaluació pública d'algorismes d'inducció de tempo; i d) en identificar direccions de recerca prometedores, particularment respecte a la selecció d'atributs instantanis més adients per al càlcul de funcions de periodicitat rítmica útils i l'estrategia per a combinar i processar multiples fonts d'informació rítmica.
- dc.description.abstract Esta disertación trata del ritmo musical. Más precisamente, trata de programas informáticos que extraen automáticamente descripciones rítmicas a partir de señales musicales de audio.<br/>Presentamos nuevos algoritmos para la inducción del tempo, la estimación del "tatum," la determinación del compás, la estimación del "swing," transformaciones de "swing" y la clasificación de estilos de música de baile. Estos algoritmos procesan directamente grabaciones digitalizadas de señales acústicas de música. La base de estos algoritmos son funciones de periodicidad rítmica: funciones que miden la importancia de una pulsación rítmica en función del periodo (o la frecuencia) de la misma, calculadas a partir de atributos físicos instantáneos seleccionados para poner en evidencia aspectos rítmicos del sonido. Estos atributos se calculan con una frecuencia de muestreo constante sobre segmentos cortos de la señal de audio.<br/>Nuestros algoritmos determinan el tempo y el "tatum" de música de diferentes géneros, con tempo casi constante, con una precisión de más de 80% si no insistimos en encontrar un nivel métrico específico. Identifican el compás con una precisión de 90%, si se conocen niveles métricos más rápidos. Clasifican música de baile en 8 categorías con una precisión de 80% tomando en cuenta solamente aspectos rítmicos de la música. Finalmente, añaden (o sustraen) el "swing" de señales musicales de audio de manera automática, conservando una cualidad de sonido muy buena.<br/>De un punto de vista más general, está disertación contribuye de manera significativa al campo de la descripción computacional del ritmo a) en proponer un entorno unificador de análisis funcional; b) en revisar la arquitectura de muchos sistemas existentes respecto a los bloques funcionales de este entorno; c) en organizar la primera evaluación pública de algoritmos de inducción del tempo; y d) en identificar direcciones de investigación prometedoras, particularmente respecto a la selección de los mejores atributos instantáneos para el cálculo de funciones de periodicidad rítmica útiles y la estrategia para combinar y procesar múltiples fuentes de información rítmica.
- dc.description.abstract Programa de doctorat en Tecnologies de la Informació i les Comunicacions
- dc.format application/pdf
- dc.format application/pdf
- dc.identifier 8468972568
- dc.identifier http://www.tdx.cat/TDX-0216106-141408
- dc.identifier http://hdl.handle.net/10803/7484
- dc.identifier B.10835-2006
- dc.identifier.uri http://hdl.handle.net/10230/12275
- dc.language.iso eng
- dc.publisher Universitat Pompeu Fabra
- dc.rights ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
- dc.rights info:eu-repo/semantics/openAccess
- dc.source TDX (Tesis Doctorals en Xarxa)
- dc.subject.keyword funcions de periodicitat rítmica
- dc.subject.keyword descripció computacional
- dc.subject.keyword clasificació musical
- dc.subject.keyword rítmo
- dc.subject.keyword selecció d'atributs
- dc.subject.keyword descripción computacional
- dc.subject.keyword funciones de periodicidad rítmica
- dc.subject.keyword clasificación musical
- dc.subject.keyword selección de atributos
- dc.subject.keyword tempo
- dc.subject.keyword swing
- dc.subject.keyword ritme
- dc.subject.keyword tatum
- dc.subject.keyword 62
- dc.subject.keyword 78
- dc.title A computational approach to rhythm description - Audio features for the computation of rhythm periodicity functions and their use in tempo induction and music content processing
- dc.type info:eu-repo/semantics/doctoralThesis
- dc.type info:eu-repo/semantics/publishedVersion