CRiSOLBase de Conocimiento de Opiniones para el Español

  1. M. Dolores Molina González
  2. Eugenio Martínez Cámara
  3. M. Teresa Martín Valdivia
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2015

Número: 55

Páginas: 143-150

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

El presente trabajo se centra en la clasificación de polaridad de comentarios de hoteles en español (COAH) y presenta un nuevo recurso léxico, CRiSOL. Este nuevo recurso toma como base la lista de palabras de opinión iSOL, a la cual incluye los valores de polaridad de los synsets de SentiWordNet. Debido a que SentiWordNet no es un recurso para español, se ha tenido que usar como pivote la versión española de WordNet incluida en el Repositorio Central Multilingüe (MCR). Se ha desarrollado un clasificador de la polaridad no supervisada para evaluar la validez de CRiSOL. Los resultados obtenidos con CRiSOL superan los obtenidos por los lexicones base iSOL y SentiWordNet por separado, lo cual nos anima a seguir trabajando en esta línea.

Referencias bibliográficas

  • Atserias, J., L. Villarejo, G. Rigau, E. Agirre, J. Carroll, B. Magnini, y P. Vossen. 2004. The meaning multilingual central repository. En GWC 2012 6th International Global Wordnet Conference. Brno: Masaryk University.
  • Baccianella, S., A. Esuli, y F. Sebastiani. 2010. Sentiwordnet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining. En Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC’10), páginas 2200–2204, Valletta, Malta.
  • Boldrini, E., A. Balahur, P. Martínez-Barco, y A. Montoyo. 2009. Emotiblog: a finegrained model for emotion detection in non-traditional textual genres. En WOMSA, páginas 22–31.
  • Brooke, J., M. Tofiloski, y M. Taboada. 2009. Cross-linguistic sentiment analysis: From english to spanish. En Proceedings of the International Conference RANLP2009, páginas 50–54, Borovets, Bulgaria, September. ACL.
  • Cambria, E. y A. Hussain. 2012. Sentic Computing, volumen 2 de SpringerBriefs in Cognitive Computation. Springer Netherlands.
  • Cruz, F., J. A. Troyano, F. Enriquez, y J. Ortega. 2008. Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español. Procesamiento del Lenguaje Natural, 41:73– 80.
  • Cruz, Fermín L., Jose A. Troyano, Beatriz Pontes, y F. Javier Ortega. 2014. Mlsenticon: a multilingual, lemma-level sentiment lexicon. Procesamiento del Lenguaje Natural, 53:113–120.
  • Gonzalez-Agirre, A., E. Laparra, y G. Rigau. 2012. Multilingual central repository version 3.0. En Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC’12), Istanbul, Turkey, may. European Language Resources Association (ELRA).
  • Kennedy, A. y D. Inkpen. 2006. Sentiment classification of movie reviews using contextual valence shifters. Computational Intelligence, 22(2):110–125.
  • Liu, B. 2012. Sentiment analysis and opinion mining. Synthesis Lectures on Human Language Technologies, 5(1):1–167.
  • Martínez-Cámara, E., M. T. MartínValdivia, M. D. Molina-González, y J. M. Perea-Ortega. 2014. Integrating spanish lexical resources by meta-classifiers for polarity classification. Journal of Information Science, 40(4):538–554.
  • Martínez-Cámara, E., M. T. MartínValdivia, M. D. Molina-González, y L. A. Ureña López. 2013. Bilingual experiments on an opinion comparable corpus. En Proceedings of the 4th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis, páginas 87–93, Atlanta, Georgia. ACL.
  • Molina-González, M. D., E. Martínez-Cámara, M. T. Martín-Valdivia, y L. A. UreñaLópez. 2014. Cross-domain sentiment analysis using spanish opinionated words. En Natural Language Processing and Information Systems, volumen 8455. Springer International Publishing, páginas 214– 219.
  • Molina-González, M. D., E. Martínez-Cámara, María T. Martín-Valdivia, y J. M. Perea-Ortega. 2013. Semantic orientation for polarity classification in spanish reviews. Expert Systems with Applications, 40(18):7250–7257.
  • Pang, B. y L. Lee. 2008. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, 2(1-2):1– 135.
  • Pang, Bo, Lillian Lee, y Shivakumar Vaithyanathan. 2002. Thumbs up?: Sentiment classification using machine learning techniques. En Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing, volumen 10 de EMNLP ’02, páginas 79–86, Stroudsburg, PA, USA. Association for Computational Linguistics.
  • Prabowo, R. y M. Thelwall. 2009. Sentiment analysis: A combined approach. Journal of Informetrics, 3(2):143 – 157.
  • Rangel, I. D., G. Sidorov, y S. Suárez-Guerra. 2014. Creación y evaluación de un diccionario marcado con emociones y ponderado para el español. Onomázein, 1(29):31–46.
  • Tsytsarau, M. y T. Palpanas. 2012. Survey on mining subjective data on the web. Data Min. Knowl. Discov., 24(3):478–514.
  • Turney, P. D. 2002. Thumbs up or thumbs down?: Semantic orientation applied to unsupervised classification of reviews. En Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, ACL ’02, páginas 417–424, Stroudsburg, PA, USA. ACL.
  • Wolpert, D. H. 1992. Stacked generalization. Neural Networks, 5(2):241 – 259.