Búsqueda de respuestas multilingüeclasificación de preguntas en español basadas en aprendizaje
- Fernando Martínez Santiago 1
- Montejo Ráez, Arturo 1
- Ureña López, Luis Alfonso 1
- García Cumbreras, Miguel Ángel 1
-
1
Universidad de Jaén
info
ISSN: 1135-5948
Año de publicación: 2005
Número: 34
Páginas: 31-40
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
Este artículo presenta un sistema de clasificación de preguntas en español basado en aprendizaje, utilizando colecciones en inglés y diversas máquinas de traducción online como recursos de traducción de la pregunta original en español al inglés. En este estudio se mide de forma cuantitativa la bondad de cuatro traductores automáticos para la pareja de idiomas español-inglés, comparando los resultados obtenidos para las preguntas originales en inglés con los obtenidos de cada una de las traducciones. El sistema se ha implementado de forma modular utilizando varios métodos de aprendizaje tales como LibSVM, Bayesian Logistic Regresalon o PLAUM. En la tarea de clasificación de preguntas se demuestra que la pérdida de precisión debida a la traducción automática es moderada, situandose entorno a un 5%.