Investigación y desarrollo de técnicas de estimación multi-pitch y su aplicación a la transcripción automática de señales musicales y polifónicas

  1. CAÑADAS QUESADA, FRANCISCO JESUS
Dirigida por:
  1. P. Vera-Candeas Director
  2. Nicolás Ruiz Reyes Codirector

Universidad de defensa: Universidad de Jaén

Fecha de defensa: 18 de diciembre de 2009

Tribunal:
  1. José Escolano Carrasco Presidente
  2. Francisco López Ferreras Presidente/a
  3. Miroslav Zivanovic Jeremic Vocal
  4. Juan Jose Burred Sendino Vocal
  5. José Javier López Monfort Vocal
Departamento:
  1. INGENIERÍA DE TELECOMUNICACIÓN

Tipo: Tesis

Teseo: 291890 DIALNET

Resumen

La tarea cognitiva de separar y reconocer un sonido determinado entre todos los existentes en una señal mezcla se denomina analisis de la escena auditiva (asa son las siglas de auditory scene analysis). A pesar de la complejidad que conllevan las tareas realizadas (selección y separación de fuentes de sonido), son tareas realizadas por el sistema auditivo humano en segundo plano o de manera casi inconsciente. Otras tareas no menos complejas realizadas por dicho sistema son la memorización de la melodía o ritmo de una determinada canción, identificación del número de instrumentos presentes en un instante determinado de una pieza musical, reconocimiento de la familia instrumental y del tipo de instrumento en particular,... Así, mientras estas tareas son triviales desde el punto de vista humano, presentan una enorme complejidad desde el puno de vista de la aústica y procesado digital de señal, complejidad que se incrementa a medida que la señal aumenta su riqueza polifónica a través del número de fuentes de sonido simultáneas en la escena aauditiva (por ejemplo, señales musicales polifónicas). Esta tesis se centra en el desarrollo de un sistema de trnscripción musical de señales polifónicas mediante técnicas de estimación multi-pitch y t''Ecnicas que solucionen los problemas que surgen cuando existen sonidos concurrentes donde sus frecuencias fundamentales presentan una relación racional, situación que dificulta la extracción de cada fuente auditiva existente en la escena ya que la extracción del primer sonido lleva implícito el deterioro del resto de sonidos al eliminar parte de sus estructuras armónicas.