Búsqueda de Respuestas multilingüe¿es buena idea buscar respuestas en otros idiomas distintos a los de la pregunta?

  1. García Cumbreras, Miguel Ángel
  2. Ureña López, Luis Alfonso
  3. Martínez Santiago, Fernando
  4. Perea Ortega, José Manuel
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2010

Número: 44

Páginas: 75-82

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Actualmente existen algunas iniciativas dentro de la tarea de Búsqueda de Respuestas orientadas al desarrollo de sistemas capacitados para encontrar respuestas sobre colecciones multilingües. Esto es, el usuario puede formular su consulta en diversos idiomas, y puede obtener la respuesta a partir de colecciones documentales escritas igualmente en diversos idiomas. Por un lado, para una pregunta dada, buscar en más documentos conlleva más documentos relevantes y por lo tanto mayor probabilidad de encontrar una respuesta satisfactoria. Por otro lado, la multilingualidad requiere necesariamente de un proceso de traducción automática, bien de la consulta, bien de los pasajes relevantes o bien de ambos, con la consiguiente introducción de ruido ¿Hasta qué punto ese ruido distorsiona los resultados? ¿Aportan todas las colecciones monolingües al rendimiento global del sistema multilingüe o por el contrario depende de cómo de bien representado esté ese idioma dentro del sistema multilingüe? En este trabajo hemos encontrado que un sistema de búsquedas de respuestas multilingüe puede superar a uno monolingüe, y que la aportación de cada idioma es desigual, pero en todos los casos es significativa.

Referencias bibliográficas

  • Aceves-Pérez, R. M., M. Montes-G´omez, L. Villaseñor, y L. A. Ureña. 2008. Two approaches for multilingual question answering: Merging passages vs. merging answers. International Journal of Computational Linguistics and Chinese Language Processing Special Issue on Cross-Lingual Information Retrieval and Question Answering, 13(1).
  • García Cumbreras, M.A. 2009. BRUJA: Un sistema de Búsqueda de Respuestas Multilingüe. Ph.D. tesis, Universidad de Jaén. García Cumbreras, M.A., F. Mart´ınez Santiago, L.A. Ureña-López, y J.M. Perea Ortega. 2009. Evaluación del algoritmo de fusión documental 2steprsv en un sistema de búsqueda de respuestas multilingüe. En Revista Sociedad Española para el Procesamiento del Lenguaje Natural.
  • García Cumbreras, M.A., L.A. Ureña-López, F. Mart´ınez Santiago, y J.M. Perea Ortega. 2007. Bruja system. the university of ja´en at the spanish task of qa@clef 2006. En Proceedings of the Cross Language Evaluation Forum (CLEF 2006).
  • Gómez-Soriano, J.M., M. Montes y Gómez, E. Sanchis-Arnal, y P. Rosso. 2005. A passage retrieval system for multilingual question answering. En 8th International Conference of Text, Speech and Dialogue 2005 (TSD’05).
  • Martínez-Santiago, Fernando, Miguel Angel García-Cumbreras, y Luis Alfonso Ure˜na- López. 2006. Does pseudo-relevance feedback improve distributed information retrieval systems? Inf. Process. Manage., 42(5):1151–1162.
  • Martínez-Santiago, Fernando, Maite Martín- Valdivia, y Luis Alfonso Ure˜na-L´opez. 2006. A merging strategy proposal: The 2-step retrieval status value method. Information Retrieval, 9(1):71–93.
  • Robertson, S. E. y S.Walker. 1999. Okapikeenbow at trec-8. En Proceedings of Text Retrieval Conference (TREC-8).