Análisis de técnicas PLN de expansión de consulta aplicadas a la tarea de la recuperación de información geográfica

  1. Perea Ortega, José Manuel
  2. García Cumbreras, Miguel Ángel
  3. Ureña López, Luis Alfonso
  4. Montejo Ráez, Arturo
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2012

Número: 49

Páginas: 41-48

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este trabajo, proponemos diferentes t´ecnicas relacionadas con el Procesamiento del Lenguaje Natural (PLN) para reformular las consultas geogr´aficas lanzadas a un sistema GIR. Est´as t´ecnicas consistir´an en la modificaci´on y/o expansi ´on de las dos partes normalmente reconocidas en una consulta geogr´afica: la parte tem´atica y la parte geogr´afica. Hemos evaluado cada una de las reformulaciones propuestas utilizando un marco de experimentaci´on para evaluar sistemas GIR como GeoCLEF. Los resultados obtenidos demuestran que todas las reformulaciones de consulta propuestas recuperaron documentos relevantes que no fueron recuperados utilizando la consulta original, por lo que estas estrategias se pueden considerar de utilidad a la hora de trabajar con sistemas GIR.

Referencias bibliográficas

  • Amati, G. 2003. Probabilistic Models for Information Retrieval based on Divergence from Randomness. Ph.D. tesis, School of Computing Science, University of Glasgow.
  • Anick, Peter. 2003. Using terminological feedback for web search refinement: a logbased study. En SIGIR '03: Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval, páginas 88–95, New York, NY, USA. ACM.
  • Baeza-Yates, Ricardo A. y Berthier Ribeiro-Neto. 1999. Modern Information Retrie-val. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA.
  • Buscaldi, Davide, Paolo Rosso, y Emilio Sanchis Arnal. 2005. Using the wordnet ontology in the geoclef geographical information retrieval task. En CLEF, volumen 4022 de Lecture Notes in Computer Science, páginas 939–946. Springer.
  • Cardoso, Nuno y Mário J. Silva. 2007. Query expansion through geographical feature types. En Ross Purves y Chris Jones, editores, GIR, páginas 55–60. ACM.
  • Fu, Gaihua, Christopher B. Jones, y Alia I. Abdelmoty. 2005. Ontology-based spatial query expansion in information retrieval. En OTM Conferences (2), volumen 3761 de Lecture Notes in Computer Science, páginas 1466–1482. Springer.
  • Gan, Qingqing, Josh Attenberg, Alexander Markowetz, y Torsten Suel. 2008. Analysis of geographic queries in a search engine log. En Proceedings of the first international workshop on Location and the web, páginas 49–56, Beijing, China. ACM.
  • Gey, Fredric C., Ray R. Larson, Mark Sanderson, Hideo Joho, Paul Clough, y Vivien Petras. 2005. GeoCLEF: The CLEF 2005 Cross-Language Geographic Information Retrieval Track Overview. En CLEF, volumen 4022 de Lecture Notes in Computer Science, páginas 908–919. Springer.
  • Gravano, L., V. Hatzivassiloglou, y R. Lichtenstein. 2003. Categorizing web queries according to geographical locality. En Proceedings of the 12th International Conference on Information and Knowledge Management, páginas 325–333.
  • Jansen, Bernard J., Danielle L. Booth, y Amanda Spink. 2009. Patterns of query reformulation during web searching. JA SIST, 60(7):1358–1371.
  • Jones, Christopher B. y Ross S. Purves. 2008. Geographical information retrieval. International Journal of Geographical Information Science, 22(3):219–228.
  • Jones, Rosie, Wei Vivian Zhang, Benjamin Rey, Pradhuman Jhala, y Eugene Stipp. 2008. Geographic intention and modification in web search. International Journal of Geographical Information Science, 22(3):229–246.
  • Kohler, J. 2003. Analysing search engine queries for the use of geographic terms. Master’s thesis, University of Sheffield - United King.
  • Larson, R. 1996. Geographic information retrieval and spatial browsing. En Smith y M. Gluck, editores, Geographic Information Systems and Libraries: Patronsand Mapsand and Spatial Information, páginas 81–124.
  • Mandl, Thomas, Paula Carvalho, Giorgio Maria Di Nunzio, Fredric C. Gey, Ray R. Larson, Diana Santos, y Christa Womser-Hacker. 2008. GeoCLEF 2008: The CLEF 2008 Cross-Language Geographic Information Retrieval Track Overview. En CLEF, volumen 5706 de Lecture Notes in Computer Science, páginas 808–821. Springer.
  • Perea-Ortega, José M., Miguel A. García-Cumbreras, Manuel García-Vega, y L. Alfonso Ureña-López. 2008a. Comparing several textual information retrieval systems for the geographical information retrieval task. En NLDB, volumen 5039 de Lecture Notes in Computer Science, p´aginas 142–147. Springer.
  • Perea-Ortega, José M., Luis Alfonso Ureña-López, Manuel García-Vega, y Miguel Angel García-Cumbreras. 2008b. Using query reformulation and keywords in the geographic information retrieval task. En CLEF, volumen 5706 de Lecture Notes in Computer Science, páginas 855–862. Springer.
  • Sanderson, M. y J. Kohler. 2004. Analyzing geographic queries. En Proceedings Workshop on Geographical Information Retrieval SIGIR.
  • Spink, Amanda, Bernard J. Jansen, y Cenk H. Ozmultu. 2000. Use of query reformulation and relevance feedback by excite users. Internet Research: Electronic Networking Applications and Policy, 10(4):317–328.
  • Stokes, Nicola, Yi Li, Alistair Moffat, y Jiawen Rong. 2008. An empirical study of the effects of nlp components on geographic ir performance. International Journal of Geographical Information Science, 22(3):247–264.