Fusión de datos estadísticamente dependientes en sistemas de detección

  1. Soriano Tolosa, Antonio
Supervised by:
  1. Luis Vergara Domínguez Director

Defence university: Universitat Politècnica de València

Fecha de defensa: 16 December 2013

Committee:
  1. Jorge Igual García Chair
  2. Saturnino Maldonado Bascón Secretary
  3. Nicolás Ruiz Reyes Committee member

Type: Thesis

Abstract

La presente tesis se centra en la problemática existente a la hora de implementar un sistema de detección o clasificación binaria cuando es necesario combinar, integrar o fusionar diversas fuentes de información que pueden ser dependientes y heterogéneas entre sí. Las técnicas de fusión de datos tratan de combinar múltiples fuentes de información para alcanzar la exactitud y precisión en la toma de decisiones que no sería posible conseguir con el uso de una sola fuente de información de forma aislada. En un sistema de detección se pueden encontrar diferentes etapas y niveles de fusión: en la etapa de pre-detección encontramos los niveles de fusión de sensores y de características, donde se combinan los diferentes flujos de muestras proporcionados por una serie de sensores o diferentes características obtenidas del procesado estos; en la etapa de post-detección, se realiza la combinación de diferentes detectores, a través de la fusión de valoraciones continuas o de decisiones individuales aportadas por cada uno de ellos. Atendiendo al tipo de datos a combinar encontramos dos grupos: fusión soft, donde se combinan datos modelados mediante variables aleatorias continuas, caracterizadas mediante sus funciones de densidad de probabilidad (PDFs), o fusión hard, asociada a la combinación de las decisiones individuales tomadas en la etapa de fusión de detectores, donde se combinan datos binarios modelados mediante variables aleatorias discretas, caracterizadas por funciones de masa de probabilidad. Se destaca la fusión de scores como un caso particular de fusión soft asociada a la fusión de diversos detectores, en donde los datos a combinar presentan buenas propiedades discriminatorias de forma aislada y se encuentran definidos en un mismo rango normalizado [0,1]. En el presente trabajo se ha realizado una completa revisión del estado del arte en cuanto a técnicas de fusión y combinación de datos aplicadas en problemas de detección donde los datos pueden ser heterogéneos y dependientes entre sí. Se realiza una revisión en mayor profundidad de la técnica de estimación de PDFs basada en la teoría de cópulas, la cual puede ser usada en la fusión óptima de datos soft. Se destaca de forma especial tanto por su novedad e incipiente uso en el campo del procesado de señal, como por su adecuación en problemas de detección, permitiéndonos modelar de forma aislada las funciones marginales de los datos y la estructura de dependencia presente entre ellos, simplificando el problema de modelado de PDFs de datos heterogéneos y dependientes. Se ha propuesto una nueva técnica de fusión soft denominada integración-¿, basada en una función de media-¿, la cual, sin elevar mucho la complejidad, aporta un mayor grado de flexibilidad y de adaptación, siendo capaz de mejorar las prestaciones que se pueden obtener con respecto al resto de técnicas subóptimas utilizadas comúnmente en problemas de fusión de scores heterogéneos y dependientes entre sí. Se ha derivado un novedoso método de entrenamiento basado en el criterio de maximización parcial del área bajo la curva ROC. Se han utilizado diversas bases de datos públicas para poder testear y comprobar el correcto funcionamiento de las técnicas de fusión propuestas en problemas de autentificación multibiométrica. También se han aplicado algunas de las técnicas de fusión en la mejora de un sistema de detección de eventos acústicos. Se ha propuesto un nuevo tipo de detector basado en la teoría de cópulas denominado COCD para lidiar con el problema de la detección de señal desconocida en presencia de ruido aleatorio dependiente y no Gaussiano, centrándonos en su utilización para una aplicación de detección de eventos sonoros desconocidos. También se realiza un estudio de fusión de más de un canal de audio (utilizando más de un micrófono para captar diferentes señales) como método para incrementar las prestaciones obtenidas.