|
Abstract:
|
El consum de la música ha canviat dràsticament en els últims anys. Ambl’arribada de la música digital, el cost de producció s’ha reduït considerablement.L’expansió de la Web ha ajudat a promoure l’exploració de molt méscontingut musical. Algunes botigues musicals on-line, com iTunes o Amazon,posseeixen milions de cançons a les seves col.leccions. No obstant, accedir aaquestes col.leccions d’una manera eficient és encara un gran repte.En aquesta tesis ens centrem en el problema d’anotar col.leccions musicalsamb paraules semàntiques, també conegudes com tags. Els mètodes utilitzatsen aquesta tesi estan fonamentats sobre els camps de recuperació de lainformació, l’inteligència artificial, i el procesament del senyal. Proposem unalgorisme per anotar música automàticament, utilitzant similitud d’audio anivell de contingut per propagar tags entre cançons. L’algorisme s’avalua extensamentutilitzant múltiples col.leccions musicals de diferent mida i qualitatde les dades, incloent una col.lecció de més de mig milió de cançons, anotadesamb tags socials derivats d’una comunitat musical. Avaluem la qualitat delnostre algorisme mitjançant una comparació amb algorismes de l’estat de l’art.Addicionalment, discutim la importància d’utilitzar mesures de avaluació quecobreixen diferents dimensions, és a dir, avaluacions a nivell de cançó i a nivellde tag. El nostre algorisme ha estat avaluat i s’ha classificat en altes posicionsen el concurs d’avaluació internacional MIREX 2011. Els resultats obtingutstambé demostren algunes limitacions de l’anotació automàtica, relacionadesamb les inconsistències en les dades, la correlació de conceptes i la dificultatde capturar alguns tags personals amb informació del contingut. Això és mésevident en les comunitats musicals, on els usuaris poden anotar cançons ambqualsevol paraula, sigui aquesta contextual o no. Per tal d’abordar aquesteslimitacions, presentem un ampli estudi sobre la naturalesa de les folksonomiesmusicals. Concretament, estudiem si les anotacions fetes per una gran comunitatd’usuaris coincideixen amb un vocabulari més controlat i estructurat perpart d’experts en el camp. Els resultats revelen que alguns tags estan claramentdefinits i compresos tant des del punt de vista dels experts com el dela saviesa popular, mentre que n’hi ha d’altres sobre els quals és difícil trobarun consens. Finalment, estenem el nostre previ treball a un ampli ventallde conceptes semàntics. Presentem un nou métode per a descobrir conceptessemàntics implícits en els tags socials, i classificar aquests tags pel que fa alsconceptes semàntics. Les darreres troballes poden ajudar a entendre la naturalesadels tags socials, i per tant ser beneficials per a una addicional millorade la anotació automàtica de la música.
Music consumption has changed drastically in the last few years. With thearrival of digital music, the cost of production has substantially dropped. Theexpansion of the World Wide Web has helped to promote the exploration ofmany more music content. Online stores, such as iTunes or Amazon, own musiccollections in the order of millions of songs. Accessing these large collectionsin an effective manner is still a big challenge.In this dissertation we focus on the problem of annotating music collectionswith semantic words, also called tags. The foundations of all the methodsused in this dissertation are based on techniques from the fields of informationretrieval, machine learning, and signal processing. We propose an automaticmusic annotation algorithm that uses content-based audio similarity to propagatetags among songs. The algorithm is evaluated extensively using multiplemusic collections of varying size and quality of the data, including a large musiccollection of more than a half million songs, annotated with social tags derivedfrom a music community. We assess the quality of our proposed algorithmby comparing it with several state of the art approaches. We also discuss theimportance of using evaluation measures that cover different dimensions; per–song and per–tag evaluation. Our proposal achieves state of the art results,and has ranked high in the MIREX 2011 evaluation campaign. The obtainedresults also show some limitations of automatic tagging, related to data inconsistencies,correlation of concepts and the difficulty to capture some personaltags with content information. This is more evident in music communites,where users can annotate songs with any free text word. In order to tacklethese issues, we present an in-depth study of the nature of music folksonomies.We concretely study whether tag annotations made by a large community (i.e.a folksonomy) correspond with a more controlled, structured vocabulary byexperts in the music and the psychology fields. Results reveal that some tagsare clearly defined and understood both by the experts and the wisdom ofcrowds, while it is difficult to achieve a common consensus on the meaning ofother tags. Finally, we extend our previous work to a wide range of semanticconcepts. We present a novel way to uncover facets implicit in social tagging,and classify the tags with respect to these semantic facets. The latter findingscan help to understand the nature of social tags, and thus be beneficial forfurther improvement of semantic tagging of music.Our findings have significant implications for music information retrieval systemsthat assist users to explore large music collections, digging for contentthey might like.
El consumo de la música ha cambiado drásticamente en los últimos años. Conla llegada de la música digital, el coste de producción se ha reducido considerablemente.La expansión de la Web ha ayudado a promover la exploración demucho más contenido musical. Algunas tiendas musicales on-line, como iTuneso Amazon, poseen millones de canciones en sus colecciones. Sin embargo,acceder a estas colecciones de una manera eficiente es todavía un gran reto.En esta tesis nos centramos en el problema de anotar colecciones musicales conpalabras semánticas, también conocidas como tags. Los métodos utilizados enesta tesis están cimentados sobre los campos de recuperación de la información,la inteligencia artifical, y el procesamiento del señal. Proponemos un algoritmopara anotar música automáticamente, usando similitud de audio a nivel decontenido para propagar tags entre canciones. El algoritmo se evalúa extensamenteusando múltiples colecciones musicales de distinto tamaño y calidadde los datos, incluyendo una colección de más de medio millón de canciones,anotadas con tags sociales derivados de una comunidad musical. Evaluamosla calidad de nuestro algoritmo mediante una comparación con algoritmos delestado del arte. Adicionalmente, discutimos la importancia de usar medidas deevaluación que cubren diferentes dimensiones; es decir, evaluaciones a nivel decanción y a nivel de tag. Nuestro algoritmo ha sido evaluado y se clasificado enaltas posiciones en el concurso de evaluación internacional MIREX 2011. Losresultados obtenidos también demuestran algunas limitaciones de la anotaciónautomática, relacionadas con las inconsistencias en los datos, la correlación deconceptos y la dificultad de capturar algunos tags personales con informacióndel contenido. Esto es más evidente en las comunidades musicales, donde losusuarios pueden anotar canciones con cualquier palabra, sea esta contextual ono. Con el fin de abordar estas limitaciones, presentamos un amplio estudio sobrela naturaleza de las folksonomías musicales. Concretamente, estudiamos silas anotaciones hechas por una gran comunidad de usuarios concuerdan con unvocabulario más controlado y estructurado por parte de expertos en el campo.Los resultados revelan que algunos tags están claramente definidos y comprendidostanto desde el punto de vista de los expertos como el de la sabiduríapopular, mientras que hay otros tags sobre los cuales es difícil encontrar unconsenso. Por último, extendemos nuestro previo trabajo a un amplio abanicode conceptos semánticos. Presentamos un método novedoso para descubrirconceptos semánticos implícitos en los tags sociales, y clasificar dichos tagscon respecto a los conceptos semánticos. Los últimos hallazgos pueden ayudara entender la naturaleza de los tags sociales, y por consiguiente ser beneficialespara una adicional mejora para la anotación automática de la música.
|