Recuperacion de informacion multimodal basado en integracion del conocimiento

  1. Díaz Galiano, Manuel Carlos
Zuzendaria:
  1. Luis Alfonso Ureña López Zuzendaria
  2. María Teresa Martín Valdivia Zuzendaria

Defentsa unibertsitatea: Universidad de Jaén

Fecha de defensa: 2011(e)ko apirila-(a)k 14

Epaimahaia:
  1. Manuel Palomar Sanz Presidentea
  2. Arturo Montejo Ráez Idazkaria
  3. Paloma Martínez Fernández Kidea
  4. Emilio Sanchís Arnal Kidea
  5. Ana M. García Serrano Kidea
Saila:
  1. INFORMÁTICA

Mota: Tesia

Teseo: 311112 DIALNET

Laburpena

Este trabajo pretende integrar conocimiento y técnicas de filtrado de la información para mejorar los sistemas de Recuperación de Información Multimodal. Los sistemas de Recuperación de Información (IR) tradicionales se ocupan básicamente de tratar con información textual. No obstante, la cantidad de información electrónica existente hoy en día no es solo textual, sino más bien, multimodal. Dentro de la multimodalidad nos referimos a cualquier formato que incluya información textual, imágenes, video o audio, y en la mayoría de los casos se suele encontrar mezclada. Existen sistemas especializados en la extracción de información en formatos distintos al texto. De esta forma podemos encontrar sistemas de Recuperación de Imágenes Basados en el Contenido, sistemas extraen características de videos o sistemas que transcriben conversaciones a texto. En la mayoría de ellos la información obtenida termina expresándose de forma textual, por lo que, al final se suelen utilizar técnicas tradicionales en el tratamiento de texto. Un sistema multimodal es aquel que recupera información de grandes colecciones en formatos distintos. De esta forma se pueden explotar las bondades de distintos sistemas especializados: esta multimodalidad permite, por ejemplo, que sistemas CBIR puedan ser mejorados utilizando información textual que aparece junto a las imágenes. Estos sistemas son útiles también para distintos tipos de profesionales que necesitan trabajar con otros formatos distintos al texto. Dentro de este ámbito podemos considerar el trabajo médico, el cual genera grandes volúmenes de información sobre cada caso clínico, incluyendo texto e imágenes de las distintas pruebas realizadas. El trabajo consiste en estudiar cómo se ve afectado un sistema multimodal, al filtrar e incluir conocimiento específico a la información textual disponible. Para ello se utilizan los corpus multimodales que ponen a nuestra disposición distintos foros de evaluación de estos sistemas. Nos centraremos en los corpus ofrecidos por ImageCLEFmed, ya que tratan un entorno más específico comoe s el entorno médico.