Generación automática de síntesis de opiniones. Minería de datos descriptiva aplicada al procesamiento del lenguaje natural

  1. López Campos, Miguel
Dirigida per:
  1. Victoria Luzón García Codirector/a
  2. Eugenio Martínez Cámara Codirector

Universitat de defensa: Universidad de Granada

Fecha de defensa: 24 de de juny de 2022

Tribunal:
  1. Óscar Cordón García President/a
  2. Alberto Fernández Hilario Secretari
  3. Eva Onaindia de la Rivaherrera Vocal
  4. David Camacho Fernández Vocal
  5. María José del Jesús Díaz Vocal

Tipus: Tesi

Resum

En los últimos años, debido al gran impacto de la Inteligencia Artificial en la sociedad, nacen nuevas necesidades y desafíos a la hora de desarrollar sistemas o recursos basados en Inteligencia Artificial. Estas necesidades están relacionadas con (1) la democratización de los recursos, es decir, la necesidad de métodos y recursos cada vez más accesibles y generales y (2) el desarrollo de sistemas explicables y transparentes que muestren una explicación del porqué se da una respuesta determinada. La Síntesis de Opiniones es un campo del Procesamiento del Lenguaje Natural que trata de sintetizar, a partir de un conjunto de opiniones con respecto a una entidad, qué se opina de forma general con respecto a las distintas características o aspectos de la entidad en cuestión. De esta manera, la Síntesis de Opiniones es capaz de ofrecer un conocimiento general y agregado al usuario, proveyendo una síntesis de la subjetividad expresada en múltiples opiniones. En la Síntesis de Opiniones, como en otros campos del Procesamiento del Lenguaje Natural debido a la complejidad del lenguaje natural, surge el problema de adaptación al dominio. Este problema se da cuando un método o sistema es evaluado en un dominio distinto al dominio en el que este sistema está especializado o entrenado. El problema de la adaptación al dominio es, por lo tanto, un impedimento a la hora de crear modelos generales y accesibles. Por otro lado, la mayoría de las propuestas en el campo de la Síntesis de Opiniones suelen ofrecer al usuario, a través de texto generado o extraído a partir del conjunto original de opiniones, una serie de oraciones que sintetizan la opinión general plasmada en las opiniones. Sin embargo, estas propuestas no ofrecen respuestas transparentes que expliquen en qué se basan para dar una determinada respuesta. En esta tesis consideramos que las contribuciones dentro de la Síntesis de Opiniones deben ajustarse a los nuevos desafíos de la Inteligencia Artificial ya mencionados, requiriendo de esta manera (1) contribuciones que den solución al problema de adaptación al dominio en las distintas tareas que abarca la Síntesis de Opiniones y (2) contribuciones que generen síntesis de opiniones explicables, fácilmente interpretables por parte del usuario y con métodos transparentes. Siguiendo estos requisitos, las contribuciones de esta tesis son: • Una metodología para la adaptación al dominio de modelos de clasificación de la opinión pre-entrenados mediante una combinación de las respuestas de estos modelos. • Un conjunto de opiniones en inglés para la evaluación de sistemas o metodologías de síntesis de opiniones. Este conjunto tiene anotadas categoría de aspecto y sentimiento a nivel de oración y agrupa opiniones con respecto a una única entidad. • Una metodología para la generación de síntesis de opiniones explicables, fácilmente interpretables y, además, fácilmente adaptable a distintos dominios.