COPOSCorpus Of Patient Opinions in Spanish. Application of Sentiment Analysis Techniques

  1. Jiménez Zafra, Salud M.
  2. Martínez Cámara, Eugenio
  3. Plaza-del-Arco, Flor Miriam
  4. Molina González, M. Dolores
  5. Martín Valdivia, María Teresa
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2016

Número: 57

Páginas: 83-90

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Cada día son más los usuarios interesados en la opinión que otros pacientes tienen sobre un médico o sobre temas de salud en general. De acuerdo con un estudio de 2015, el 62% de la población española consulta información en Internet acerca de temas relacionados con la salud. Este trabajo está centrado en el Análisis de Sentimientos en español aplicado al dominio médico. Aunque el Análisis de Sentimientos ha sido estudiado en diferentes dominios, el dominio de la salud apenas ha sido investigado, especialmente en opiniones escritas en español. Por ello, hemos generado un corpus en español con opiniones de pacientes sobre médicos a partir de la extracción de las mismas del portal web Masquemedicos. Este corpus ha sido denominado COPOS (Corpus Of Patient Opinions in Spanish - Corpus de Opiniones de Pacientes en Español). Hasta donde sabemos, es la primera vez que se intenta trabajar con opiniones en español sobre atención médica escritas por pacientes. Para demostrar la validez de este recurso, hemos realizado diferentes experimentos con las principales metodologías aplicadas en la tarea de clasificación de polaridad (Orientación Semántica y Aprendizaje Automático). Los resultados obtenidos nos animan a seguir investigando en el Análisis de Sentimientos en este dominio.

Referencias bibliográficas

  • Bobicev, V., M. Sokolova, Y. Jafer, and D. Schramm. 2012. Learning sentiments from tweets with personal health information. In Proceedings of the 25th Canadian Conference on Advances in Artificial Intelligence, Canadian AI’12, pages 37–48, Berlin, Heidelberg. Springer-Verlag.
  • Bobicev, V., M. Sokolova, and M. Oakes. 2015. What goes around comes around: Learning sentiments in online medical forums. Cognitive Computation, 7(5):609– 621.
  • Chapman, W. W., P. M. Nadkarni, L. Hirschman, L. W. D’Avolio, G. K. Savova, and O. Uzuner. 2011. Overcoming barriers to nlp for clinical text: the role of shared tasks and the need for additional creative solutions. Journal of the American Medical Informatics Association, 18(5):540–543.
  • Chew, C. and G. Eysenbach. 2010. Pandemics in the age of twitter: Content analysis of tweets during the 2009 h1n1 outbreak. PLoS ONE, 5(11):e14118, 11.
  • Cortes, C. and V. Vapnik. 1995. Supportvector networks. Mach. Learn., 20(3):273–297, September.
  • Denecke, K. and Y. Deng. 2015. Sentiment analysis in medical settings: New opportunities and challenges. Artificial Intelligence in Medicine, 64(1):17 – 27.
  • Deng, Y., M. Stoehr, and K. Denecke. 2014. Retrieving attitudes: Sentiment analysis from clinical narratives. pages 12–15.
  • Díaz-Galiano, M. C., M. Martín-Valdivia, and L. A. Ureña López. 2009. Query expansion with a medical ontology to improve a multimodal information retrieval system. Comput. Biol. Med., 39(4):396– 403, April.
  • Fox, S. 2011. The social life of health information, 2011. Technical report, PewResearchCenter, May.
  • Friedman, C., T. C. Rindflesch, and M. Corn. 2013. Natural language processing: State of the art and prospects for significant progress, a workshop sponsored by the national library of medicine. Journal of Biomedical Informatics, 46(5):765 – 773.
  • Greaves, F., D. Ramirez-Cano, C. Millett, A. Darzi, and L. Donaldson. 2013. Use of sentiment analysis for capturing patient experience from free-text comments posted online. JOURNAL OF MEDICAL INTERNET RESEARCH, 15.
  • Lee, M., J. Cimino, H. R. Zhu, C. Sable, V. Shanker, J. Ely, and H. Yu. 2006. Beyond information retrieval — medical question answering. In Proceedings of the AMIA Annual Symposium, pages 469– 473.
  • Liu, B. 2012. Sentiment analysis and opinion mining. Synthesis Lectures on Human Language Technologies, 5(1):1–167.
  • Martí-Valdivia, M. T., M. C. Dı́az-Galiano, A. Montejo-Raez, and L. A. Ureña López. 2008. Using information gain to improve multi-modal information retrieval systems. Inf. Process. Manage., 44(3):1146– 1158, May.
  • Martíez Cámara, E., M. T. Martí Valdivia, J. M. Perea Ortega, and L. A. Ureña López. 2011. Técnicas de clasificación de opiniones aplicadas a un corpus en español. Procesamiento del Lenguaje Natural, 47(0):163–170.
  • Molina-González, M. D., E. MartíezCámara, M. T. Martí-Valdivia, and J. M. Perea-Ortega. 2013. Semantic orientation for polarity classification in spanish reviews. Expert Syst. Appl., 40(18):7250– 7257.
  • Müller, H., A. García Seco de Herrera, J. Kalpathy-Cramer, D. Demner Fushman, S. Antani, and I. Eggel. 2012. Overview of the ImageCLEF 2012 medical image retrieval and classification tasks. In Working Notes of CLEF 2012 (Cross Language Evaluation Forum), September.
  • Niu, Y., X. Zhu, J. Li, and G. Hirst. 2005. Analysis of polarity information in medical text. In AMIA 2005, American Medical Informatics Association Annual Symposium, Washington, DC, USA, October 22-26, 2005.
  • Palotti, J. R. M., G. Zuccon, L. Goeuriot, L. Kelly, A. Hanbury, G. J. F. Jones, M. Lupu, and P. Pecina. 2015. CLEF ehealth evaluation lab 2015, task 2: Retrieving information about medical symptoms. In Working Notes of CLEF 2015 Conference and Labs of the Evaluation forum, Toulouse, September.
  • Pang, B., L. Lee, and S. Vaithyanathan. 2002. Thumbs up?: Sentiment classification using machine learning techniques. In Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing, volume 10 of EMNLP ’02, pages 79–86. ACL.
  • Sarker, A., D. Molla, and C. Paris. 2011. Outcome polarity identification of medical papers. In Proceedings of the Australasian Language Technology Association Workshop 2011, pages 105–114, Canberra, Australia, December.
  • Sokolova, M. and V. Bobicev. 2013. What sentiments can be found in medical forums? In Proceedings of the International Conference Recent Advances in Natural Language Processing RANLP 2013, pages 633–639, Hissar, Bulgaria, September. INCOMA Ltd. Shoumen, BULGARIA.
  • Turney, P. D. 2002. Thumbs up or thumbs down?: Semantic orientation applied to unsupervised classification of reviews. In Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, ACL ’02, pages 417–424, Stroudsburg, PA, USA. ACL.
  • Wei, C.-H., Y. Peng, R. Leaman, A. P. Davis, C. J. Mattingly, J. Li, T. C. Wiegers, and Z. Lu. 2015. Overview of the biocreative v chemical disease relation (cdr) task. In Proceedings of the fifth BioCreative challenge evaluation workshop.