Investigación y desarrollo de técnicas de estimación multi-pitch y su aplicación a la transcripción automática de señales musicales y polifónicas

  1. CAÑADAS QUESADA, FRANCISCO JESUS
unter der Leitung von:
  1. P. Vera-Candeas Doktorvater
  2. Nicolás Ruiz Reyes Co-Doktorvater

Universität der Verteidigung: Universidad de Jaén

Fecha de defensa: 18 von Dezember von 2009

Gericht:
  1. José Escolano Carrasco Präsident
  2. Francisco López Ferreras Präsident/in
  3. Miroslav Zivanovic Jeremic Vocal
  4. Juan Jose Burred Sendino Vocal
  5. José Javier López Monfort Vocal
Fachbereiche:
  1. INGENIERÍA DE TELECOMUNICACIÓN

Art: Dissertation

Teseo: 291890 DIALNET

Zusammenfassung

La tarea cognitiva de separar y reconocer un sonido determinado entre todos los existentes en una señal mezcla se denomina analisis de la escena auditiva (asa son las siglas de auditory scene analysis). A pesar de la complejidad que conllevan las tareas realizadas (selección y separación de fuentes de sonido), son tareas realizadas por el sistema auditivo humano en segundo plano o de manera casi inconsciente. Otras tareas no menos complejas realizadas por dicho sistema son la memorización de la melodía o ritmo de una determinada canción, identificación del número de instrumentos presentes en un instante determinado de una pieza musical, reconocimiento de la familia instrumental y del tipo de instrumento en particular,... Así, mientras estas tareas son triviales desde el punto de vista humano, presentan una enorme complejidad desde el puno de vista de la aústica y procesado digital de señal, complejidad que se incrementa a medida que la señal aumenta su riqueza polifónica a través del número de fuentes de sonido simultáneas en la escena aauditiva (por ejemplo, señales musicales polifónicas). Esta tesis se centra en el desarrollo de un sistema de trnscripción musical de señales polifónicas mediante técnicas de estimación multi-pitch y t''Ecnicas que solucionen los problemas que surgen cuando existen sonidos concurrentes donde sus frecuencias fundamentales presentan una relación racional, situación que dificulta la extracción de cada fuente auditiva existente en la escena ya que la extracción del primer sonido lleva implícito el deterioro del resto de sonidos al eliminar parte de sus estructuras armónicas.