Investigación y desarrollo de técnicas de estimación multi-pitch y su aplicación a la transcripción automática de señales musicales y polifónicas

  1. CAÑADAS QUESADA, FRANCISCO JESUS
Supervised by:
  1. P. Vera-Candeas Director
  2. Nicolás Ruiz Reyes Co-director

Defence university: Universidad de Jaén

Fecha de defensa: 18 December 2009

Committee:
  1. José Escolano Carrasco Chair
  2. Francisco López Ferreras Chair
  3. Miroslav Zivanovic Jeremic Committee member
  4. Juan Jose Burred Sendino Committee member
  5. José Javier López Monfort Committee member
Department:
  1. INGENIERÍA DE TELECOMUNICACIÓN

Type: Thesis

Teseo: 291890 DIALNET

Abstract

La tarea cognitiva de separar y reconocer un sonido determinado entre todos los existentes en una señal mezcla se denomina analisis de la escena auditiva (asa son las siglas de auditory scene analysis). A pesar de la complejidad que conllevan las tareas realizadas (selección y separación de fuentes de sonido), son tareas realizadas por el sistema auditivo humano en segundo plano o de manera casi inconsciente. Otras tareas no menos complejas realizadas por dicho sistema son la memorización de la melodía o ritmo de una determinada canción, identificación del número de instrumentos presentes en un instante determinado de una pieza musical, reconocimiento de la familia instrumental y del tipo de instrumento en particular,... Así, mientras estas tareas son triviales desde el punto de vista humano, presentan una enorme complejidad desde el puno de vista de la aústica y procesado digital de señal, complejidad que se incrementa a medida que la señal aumenta su riqueza polifónica a través del número de fuentes de sonido simultáneas en la escena aauditiva (por ejemplo, señales musicales polifónicas). Esta tesis se centra en el desarrollo de un sistema de trnscripción musical de señales polifónicas mediante técnicas de estimación multi-pitch y t''Ecnicas que solucionen los problemas que surgen cuando existen sonidos concurrentes donde sus frecuencias fundamentales presentan una relación racional, situación que dificulta la extracción de cada fuente auditiva existente en la escena ya que la extracción del primer sonido lleva implícito el deterioro del resto de sonidos al eliminar parte de sus estructuras armónicas.