Aprendizaje neuronal aplicado a la fusión de colecciones multilingües en CLIR

  1. Martín Valdivia, María Teresa
  2. Martínez Santiago, Fernando
  3. Ureña López, Luis Alfonso
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2003

Número: 31

Páginas: 227-234

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Un problema común al trabajar con sistemas CLIR (Croas-Lingual Information Retrieval) basados en la traducción de consultas consiste en obtener una única lista de documentos relevantes a partir de los resultados locales obtenidos para cada colección monolingüe. En este trabajo se presenta un estudio comparativo de las estrategias tradicionalmente usadas para resolver este problema Se incluyen en el estudio dos técnicas recientes: la regresión logística y el cálculo del RSV (Retrieve Status Value) en dos pasos. Además, se presenta e implementa una nueva técnica basada en redes neuronales artificiales que utiliza el algoritmo LVQ (Learning Vector Quantization) y con la que se obtienen resultados prometedores. Como muestran los experimentos realizados, los mejores resultados son obtenidos mediante el uso de la técnica denominada RSV en dos pasos Sin embargo, este método requiere que las consultas estén alineadas a nivel de término Esto es, para cada término de la consulta, debe conocerse cómo ha sido traducido al resto de los idiomas Dado que tal información no siempre está disponible, es usual que las consultas cuenten con una parte alineada y otra no alineada Es por ello que la segunda parte del articulo, estudia la forma de integrar la información obtenida a partir de la parte alineada y la no alineada en el método RSV en dos pasos mediante el uso de regresión logística y LVQ