Recuperacion de informacion multimodal basado en integracion del conocimiento

  1. Díaz Galiano, Manuel Carlos
unter der Leitung von:
  1. Luis Alfonso Ureña López Doktorvater
  2. María Teresa Martín Valdivia Doktormutter

Universität der Verteidigung: Universidad de Jaén

Fecha de defensa: 14 von April von 2011

Gericht:
  1. Manuel Palomar Sanz Präsident/in
  2. Arturo Montejo Ráez Sekretär
  3. Paloma Martínez Fernández Vocal
  4. Emilio Sanchís Arnal Vocal
  5. Ana M. García Serrano Vocal
Fachbereiche:
  1. INFORMÁTICA

Art: Dissertation

Teseo: 311112 DIALNET

Zusammenfassung

Este trabajo pretende integrar conocimiento y técnicas de filtrado de la información para mejorar los sistemas de Recuperación de Información Multimodal. Los sistemas de Recuperación de Información (IR) tradicionales se ocupan básicamente de tratar con información textual. No obstante, la cantidad de información electrónica existente hoy en día no es solo textual, sino más bien, multimodal. Dentro de la multimodalidad nos referimos a cualquier formato que incluya información textual, imágenes, video o audio, y en la mayoría de los casos se suele encontrar mezclada. Existen sistemas especializados en la extracción de información en formatos distintos al texto. De esta forma podemos encontrar sistemas de Recuperación de Imágenes Basados en el Contenido, sistemas extraen características de videos o sistemas que transcriben conversaciones a texto. En la mayoría de ellos la información obtenida termina expresándose de forma textual, por lo que, al final se suelen utilizar técnicas tradicionales en el tratamiento de texto. Un sistema multimodal es aquel que recupera información de grandes colecciones en formatos distintos. De esta forma se pueden explotar las bondades de distintos sistemas especializados: esta multimodalidad permite, por ejemplo, que sistemas CBIR puedan ser mejorados utilizando información textual que aparece junto a las imágenes. Estos sistemas son útiles también para distintos tipos de profesionales que necesitan trabajar con otros formatos distintos al texto. Dentro de este ámbito podemos considerar el trabajo médico, el cual genera grandes volúmenes de información sobre cada caso clínico, incluyendo texto e imágenes de las distintas pruebas realizadas. El trabajo consiste en estudiar cómo se ve afectado un sistema multimodal, al filtrar e incluir conocimiento específico a la información textual disponible. Para ello se utilizan los corpus multimodales que ponen a nuestra disposición distintos foros de evaluación de estos sistemas. Nos centraremos en los corpus ofrecidos por ImageCLEFmed, ya que tratan un entorno más específico comoe s el entorno médico.