Búsqueda de respuestas multilingüeclasificación de preguntas en español basadas en aprendizaje

  1. Fernando Martínez Santiago 1
  2. Montejo Ráez, Arturo 1
  3. Ureña López, Luis Alfonso 1
  4. García Cumbreras, Miguel Ángel 1
  1. 1 Universidad de Jaén
    info

    Universidad de Jaén

    Jaén, España

    ROR https://ror.org/0122p5f64

Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2005

Número: 34

Páginas: 31-40

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Este artículo presenta un sistema de clasificación de preguntas en español basado en aprendizaje, utilizando colecciones en inglés y diversas máquinas de traducción online como recursos de traducción de la pregunta original en español al inglés. En este estudio se mide de forma cuantitativa la bondad de cuatro traductores automáticos para la pareja de idiomas español-inglés, comparando los resultados obtenidos para las preguntas originales en inglés con los obtenidos de cada una de las traducciones. El sistema se ha implementado de forma modular utilizando varios métodos de aprendizaje tales como LibSVM, Bayesian Logistic Regresalon o PLAUM. En la tarea de clasificación de preguntas se demuestra que la pérdida de precisión debida a la traducción automática es moderada, situandose entorno a un 5%.