A computational approach to rhythm description - Audio features for the computation of rhythm periodicity functions and their use in tempo induction and music content processing

Welcome to the UPF Digital Repository

Gouyon, Fabien. A computational approach to rhythm description - Audio features for the computation of rhythm periodicity functions and their use in tempo induction and music content processing. 2005
http://hdl.handle.net/10230/12275
dc.contributor.author Gouyon, Fabien
dc.contributor.other Widmer, Gerhard
dc.contributor.other Serra, Xavier
dc.contributor.other Universitat Pompeu Fabra. Institut Universitari de l'Audiovisual
dc.date.accessioned 2013-07-12T01:51:27Z
dc.date.available 2013-07-12T01:51:27Z
dc.date.issued 2005-11-30
dc.identifier.uri http://hdl.handle.net/10230/12275
dc.description.abstract Aquesta dissertació tracta del ritme musical. Més exactamente, tracta de programes informàtics que extreuen automàticament descripcions rítmiques a partir de senyals musicals d'àudio.Presentem nous algorismes per a la inducció del tempo, la estimació del "tatum," la determinació del compàs, la estimació de "swing," transformacions de "swing" i la classificació d'estils de música de ball. Aquests algorismes processen directament gravacions digitalitzades de senyals acústiques de música. La base d'aquests algorismes son funcions de periodicitat rítmica: es a dir, funcions que mesuren la importància d'una pulsació rítmica en funció del període (o la freqüència) de la mateixa, calculades a partir d'atributs físics instantanis seleccionats per a posar en evidència aspectes rítmics del só. Aquests atributs es calculen amb una freqüència de mostreig constant sobre segments curts de la senyal d'àudio. Els nostres algorismes determinen el tempo i el "tatum" de música de diferents estils musicals, amb tempo constant, amb una precisió de més del 80% si no insistim en trobar el nivell mètric específic. Indentifiquen el compàs amb una precisió del 90%, si es coneixen nivells mètrics més ràpits. Classifiquen música de ball en 8 categories amb una precisió del 80% tenint en compte únicament aspectes rítmics de la música. Finalment, afegeixen (o substreuen) el "swing" de senyals musicals d'àudio de manera automàtica, conservant una alta qualitat de só.Des d'un punt de vista més general, aquesta dissertació contribueix de manera significativa al camp de la descripció computacional del ritme a) en proposar un entorn unificador d'analisi funcional; b) en revisar l'arquitectura de molts sistemes existent respecte els blocs funcionals d'aquest entorn; c) en organitzar la primera evaluació pública d'algorismes d'inducció de tempo; i d) en identificar direccions de recerca prometedores, particularment respecte a la selecció d'atributs instantanis més adients per al càlcul de funcions de periodicitat rítmica útils i l'estrategia per a combinar i processar multiples fonts d'informació rítmica.
dc.description.abstract Esta disertación trata del ritmo musical. Más precisamente, trata de programas informáticos que extraen automáticamente descripciones rítmicas a partir de señales musicales de audio.Presentamos nuevos algoritmos para la inducción del tempo, la estimación del "tatum," la determinación del compás, la estimación del "swing," transformaciones de "swing" y la clasificación de estilos de música de baile. Estos algoritmos procesan directamente grabaciones digitalizadas de señales acústicas de música. La base de estos algoritmos son funciones de periodicidad rítmica: funciones que miden la importancia de una pulsación rítmica en función del periodo (o la frecuencia) de la misma, calculadas a partir de atributos físicos instantáneos seleccionados para poner en evidencia aspectos rítmicos del sonido. Estos atributos se calculan con una frecuencia de muestreo constante sobre segmentos cortos de la señal de audio.Nuestros algoritmos determinan el tempo y el "tatum" de música de diferentes géneros, con tempo casi constante, con una precisión de más de 80% si no insistimos en encontrar un nivel métrico específico. Identifican el compás con una precisión de 90%, si se conocen niveles métricos más rápidos. Clasifican música de baile en 8 categorías con una precisión de 80% tomando en cuenta solamente aspectos rítmicos de la música. Finalmente, añaden (o sustraen) el "swing" de señales musicales de audio de manera automática, conservando una cualidad de sonido muy buena.De un punto de vista más general, está disertación contribuye de manera significativa al campo de la descripción computacional del ritmo a) en proponer un entorno unificador de análisis funcional; b) en revisar la arquitectura de muchos sistemas existentes respecto a los bloques funcionales de este entorno; c) en organizar la primera evaluación pública de algoritmos de inducción del tempo; y d) en identificar direcciones de investigación prometedoras, particularmente respecto a la selección de los mejores atributos instantáneos para el cálculo de funciones de periodicidad rítmica útiles y la estrategia para combinar y procesar múltiples fuentes de información rítmica.
dc.format.mimetype application/pdf
dc.language.iso eng
dc.publisher Universitat Pompeu Fabra
dc.rights info:eu-repo/semantics/openAccess
dc.rights ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.title A computational approach to rhythm description - Audio features for the computation of rhythm periodicity functions and their use in tempo induction and music content processing
dc.date.modified 2013-07-10T11:48:48Z
dc.subject.keyword funcions de periodicitat rítmica
dc.subject.keyword descripció computacional
dc.subject.keyword clasificació musical
dc.subject.keyword rítmo
dc.subject.keyword selecció d'atributs
dc.subject.keyword descripción computacional
dc.subject.keyword funciones de periodicidad rítmica
dc.subject.keyword clasificación musical
dc.subject.keyword selección de atributos
dc.subject.keyword tempo
dc.subject.keyword swing
dc.subject.keyword ritme
dc.subject.keyword tatum
dc.subject.keyword 62
dc.subject.keyword 78

See full text
http://hdl.handle.net/10803/7484

Search


Advanced Search

Browse

My Account

Statistics