Recuperacion de informacion multimodal basado en integracion del conocimiento

  1. Díaz Galiano, Manuel Carlos
Dirigée par:
  1. Luis Alfonso Ureña López Directeur
  2. María Teresa Martín Valdivia Directrice

Université de défendre: Universidad de Jaén

Fecha de defensa: 14 avril 2011

Jury:
  1. Manuel Palomar Sanz President
  2. Arturo Montejo Ráez Secrétaire
  3. Paloma Martínez Fernández Rapporteur
  4. Emilio Sanchís Arnal Rapporteur
  5. Ana M. García Serrano Rapporteur
Département:
  1. INFORMÁTICA

Type: Thèses

Teseo: 311112 DIALNET

Résumé

Este trabajo pretende integrar conocimiento y técnicas de filtrado de la información para mejorar los sistemas de Recuperación de Información Multimodal. Los sistemas de Recuperación de Información (IR) tradicionales se ocupan básicamente de tratar con información textual. No obstante, la cantidad de información electrónica existente hoy en día no es solo textual, sino más bien, multimodal. Dentro de la multimodalidad nos referimos a cualquier formato que incluya información textual, imágenes, video o audio, y en la mayoría de los casos se suele encontrar mezclada. Existen sistemas especializados en la extracción de información en formatos distintos al texto. De esta forma podemos encontrar sistemas de Recuperación de Imágenes Basados en el Contenido, sistemas extraen características de videos o sistemas que transcriben conversaciones a texto. En la mayoría de ellos la información obtenida termina expresándose de forma textual, por lo que, al final se suelen utilizar técnicas tradicionales en el tratamiento de texto. Un sistema multimodal es aquel que recupera información de grandes colecciones en formatos distintos. De esta forma se pueden explotar las bondades de distintos sistemas especializados: esta multimodalidad permite, por ejemplo, que sistemas CBIR puedan ser mejorados utilizando información textual que aparece junto a las imágenes. Estos sistemas son útiles también para distintos tipos de profesionales que necesitan trabajar con otros formatos distintos al texto. Dentro de este ámbito podemos considerar el trabajo médico, el cual genera grandes volúmenes de información sobre cada caso clínico, incluyendo texto e imágenes de las distintas pruebas realizadas. El trabajo consiste en estudiar cómo se ve afectado un sistema multimodal, al filtrar e incluir conocimiento específico a la información textual disponible. Para ello se utilizan los corpus multimodales que ponen a nuestra disposición distintos foros de evaluación de estos sistemas. Nos centraremos en los corpus ofrecidos por ImageCLEFmed, ya que tratan un entorno más específico comoe s el entorno médico.