eSOLHotelGeneración de un lexicón de opinión en español adaptado al dominio turístico

  1. M. Dolores Molina González
  2. Eugenio Martínez Cámara
  3. M. Teresa Martín Valdivia
  4. Salud M. Jiménez Zafra
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2015

Número: 54

Páginas: 21-28

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Desde que la web 2.0 es el mayor contenedor de opiniones en todos los idiomas sobre distintos temas o asuntos, el estudio del Análisis de Sentimientos ha crecido exponencialmente. En este trabajo nos centramos en la clasificación de polaridad de opiniones en español y se presenta un nuevo recurso léxico adaptado al dominio turístico (eSOLHotel). Este nuevo lexicón usa el enfoque basado en corpus. Se han realizado varios experimentos usando una aproximación no supervisada para la clasificación de polaridad de las opiniones en la categoría de hoteles del corpus SFU. Los resultados obtenidos con el nuevo lexicón eSOLHotel superan los resultados obtenidos con otro lexicón de propósito general y nos animan a seguir trabajando en esta línea.

Referencias bibliográficas

  • Aue, A. y M. Gamon. 2005. Customizing sentiment classifiers to new domains: A case study. En Proceedings of Recent Advances in Natural Language Processing (RANLP).
  • Banea, C., R. Mihalcea, J. Wiebe, y S. Hassan, S. 2008. Multilingual subjectivity analysis using machine translation. En Proc. of the conference on empirical methods in natural language processing, páginas 127–135. ACL.
  • Blitzer, J., M. Dredze, y F. Pereira. 2007. Biographies, Bollywood, boom-boxes and blenders: Domain adaptation for sentiment classification. En Proceedings of the Association for Computational Linguistics (ACL).
  • Boldrini, E., A. Balahur, P. Martínez-Barco, y A. Montoyo. 2009. Emotiblog: an annotation scheme for emotion detection and analysis in non-traditional textual genres. En DMIN, páginas 491–497. CSREA Press.
  • Brooke, J., M. Tofiloski, y M. Taboada. 2009. Cross-linguistic sentiment analysis: From English to Spanish. En Proceedings of the International Conference RANLP-2009, páginas 50–54. ACL.
  • Cruz, F.L., J.A. Troyano, F. Enriquez, y J. Ortega. 2008. Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español. Procesamiento de Lenguaje Natural, Volumen 41, páginas 73-80.
  • Dehkharghani, R., B. Yanikoglu, D. Tapucu, y Y. Saygin. 2012. Adaptation and use of subjectivity lexicons for domain dependent sentiment classification. En Data Mining Workshops, 2012 IEEE 12th International Conference on, páginas 669-673.
  • Demiroz, G., B. Yanikoglu, D. Tapucu, y Y. Saygin. 2012. Learning domain-specific polarity lexicons. En Data Mining Workshops, 2012 IEEE 12th International Conference on, páginas 674-679.
  • Díaz Rangel, I., G. Sidorov y S. Suárez-Guerra. 2014. Creación y evaluación de un diccionario marcado con emociones y ponderado para el español. Onomazein, 29, 23 p
  • Ding, X. y B. Liu. 2007. The utility of linguistic rules in opinion mining. En Proc. of the 30th annual international ACM SIGIR conference on Research and development in information retrieval, páginas 811–812
  • Du, W.T., S. Cheng, y X. Yun. 2010. Adapting information bottleneck method for automatic construction of domain-oriented sentiment lexicon. En Proc. of ACM International Conference on Web search and data mining.
  • Engström, C. 2004. Topic dependence in sentiment classification. Master’s thesis, University of Cambridge.
  • Esuli, A. y F. Sebastiani. 2006. SentiWordNet: A Publicly Available Lexical Resource for Opinion Mining. En Proceedings of Language Resources and Evaluation (LREC).
  • Hatzivassiloglou, V. y K. McKeown. 1997. Predicting the semantic orientation of adjectives. En Proceedings of the eighth conference on European chapter of the association for computational linguistics, páginas 174–181.
  • Hatzivassiloglou, V. y J. Wiebe, J. 2000. Effects of adjective orientation and gradability on sentence subjectivity. En Proceedings of the international conference on computational linguistics (COLING), páginas 299–305.
  • Hu, M. y B. Liu. 2004. Mining and summarizing customer reviews. En Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Seattle, Washington, USA, páginas 168-177.
  • Kamps, J., M. Marx, R.J. Mokken, y M. de Rijke. 2004. Using WordNet to measure semantic orientations of adjectives. En LREC, European Language Resources Association.
  • Kanayama, H. y T. Nasukawa. 2006. Fully automatic lexicon expansion for domainoriented sentiment analysis. En Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP), páginas 355–363. ACL.
  • Liu, B. 2012. Sentiment analysis and opinion mining. synthesis lectures on human language technologies. Morgan and Claypool Publishers.
  • Martín-Valdivia, M.T., E. Martínez-Cámara, J.M. Perea-Ortega, y L.A. Ureña-López. 2013. Sentiment polarity detection in Spanish reviews combining supervised and unsupervised approaches. Expert Systems with Applications, 40 (10), páginas 3934– 3942.
  • Martínez-Cámara, E., M.T. Martín-Valdivia, y L.A. Ureña-López. 2011. Opinion classification techniques applied to a Spanish corpus. Proceedings of the 16th international conference on Natural language processing and information systems, NLDB’11, páginas 169–176.
  • Molina-González, M. D., E. Martínez-Cámara, M.T. Martín-Valdivia, y J.M. Perea-Ortega. 2013. Semantic Orientation for Polarity Classification in Spanish Reviews. Expert Systems with Applications; 40(18), páginas 7250-7257.
  • Owsley, S., S. Sood, y K.J. Hammond. 2006. Domain specific affective classification of documents. En AAAI Symposium on Computational Approaches to Analysing Weblogs (AAAI-CAAW), páginas 181–183.
  • Pang, B. y L. Lee. 2008. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, 2(1–2), 1–135.
  • Pang, B., L. Lee, y S. Vaithyanathan. 2002. Thums up?: Sentiment Analysis classification using machine learning techniques. En Proceedings of the ACL-02 Conference on Empirical methods in natural language processing. Stroudsburg, PA, USA: Association for Computational Linguistics; 10:79-86.
  • Taboada, M., J. Brooke, M. Tofiloski, K.D. Voll, y M. Stede. 2011. Lexicon-based methods for sentiment analysis. Computational Linguistics, 37(2), 267–307.
  • Taboada, M. y J. Grieve 2004. Analyzing appraisal automatically. Proceedings of AAAI Spring Symposium on Exploring Attitude and Affect in Text, páginas 158 - 161. Stanford University, CA.
  • Tsytsarau, M. y T. Palpanas. 2012. Survey on mining subjective data on the web. Data Mining and Knowledge. Discovery. 24, 3 478-514.
  • Turney, P. D. 2002. Thumbs up or thumbs down?: semantic orientation applied to unsupervised classification of reviews. En Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, Stroudsburg, PA, USA, páginas 417-424