Participación de SINAI Word2Vec en TASS 2014
-
1
Universidad de Jaén
info
Editorial: Sociedad Española para el Procesamiento del Lenguaje Natural
Año de publicación: 2014
Congreso: Sociedad Española para el Procesamiento del Lenguaje Natural. Congreso (30. 2014. Girona)
Tipo: Aportación congreso
Resumen
Este artículo describe el sistema de clasificación de la polaridad utili- zado por el equipo SINAI-word2vec en la tarea 1 del workshop TASS 2014. Nuestro sistema se basa en un método supervisado con SVM sobre la sumatoria de vectores de palabras con un modelo generado a partir de la Wikipedia en español. Nuestra solución no sigue el modelo espacio vectorial clásico ni aplica análisis sintáctico o léxico alguno. Considerando cada palabra de forma independiente representada en el espacio de 200 dimensiones de Word2Vec se consigue capturar la semántica de cada tweet y ofrecer unos resultados aceptables en la clasificación de la polaridad.