Chord identification in real-time using a neural network

Enllaç permanent

Descripció

  • Resum

    The necessity of musicians to transcribe by ear a music piece is a common known problem, given that the music score is not always available. Transcribing by ear is a difficult task, and for this reason, the automatic music transcription has been researched over the years. In this work we focus on the task of chord recognition, where we have implemented a a real-time musical chords detection system. First, we build a data set of audio recordings, that consists in all the major and minor chords played by a guitar in different ways. Later we label the data using 25 classes, 12 for all the major chords, 12 for all the minor chords, and the last one that consists in the class “None”. From the audio signal we extract a feature vector using the Chromagram. The Chromagram is obtained by an spectral analysis grouping the peaks corresponding to notes in to bins. With these features the system is trained to classify the considered chord classes. The first models implement major and minor chords, in the future, there will be implemented more chords like augmented, diminished, suspended etc. The system consists of a real-time implementation, where the sound coming through the mic, pass through the system and it returns a chord prediction, the objective is to build a real time interface to give visual feedback to the user.
    La idea d’aquest treball neix de la necessitat dels músics de transcriure d’oïda una peça musical, no sempre es disposa de partitura i transcriure d’oïda pot ser una gran eina, no obstant, és una tasca molt difícil, per aquesta raó s’ha desenvolupat aquest treball. Aquest treball presenta un sistema de detecció d’acords musicals a temps real. Primerament, construim una base de dades de gravacions d’audio, que consisteixen in tots els acords majors i menors tocats per una guitarra de maneres diferents. Després etiquetem les dades utilitzant 25 classes, 12 per els acords majors, 12 per els acords menors i la última per la classe “None”. De la senyal d’audio extraiem un vector de característiques del so anomenat cromagrama. El cromagrama fa un recompte de totes les notes que estan sonant i les agrupa per blocs, cada nota és un bloc. Amb aquestes característiques entrenem un sistema per què aprengui a distingir i classificar aquests acords. Els primers models només implementaven acords majors i menors, futurament seràn implementats altres com acords augmentats, disminuïts, suspesos etc. La complicació d’aquest mètode és la implementació a temps real, que el so entri per un micròfon, passi pel sistema i retorni un acord, l’objectiu is construir una interfície visual que a temps real doni informació visual a l’usuari.
  • Descripció

    Treball de fi de grau en Sistemes Audiovisuals
    Tutor: Sergio Ivan Giraldo Mendez
  • Mostra el registre complet