SINAI at Twitter-Normalization 2013
- Arturo Montejo Ráez 1
- M. Carlos Diaz Galiano 1
- Eugenio Martínez Cámara 1
- M. Teresa Martín Valdivia 1
- Miguel A. García Cumbreras 1
- L. Alfonso Ureña López 1
-
1
Universidad de Jaén
info
- Alberto Díaz Esteban (coord.)
- Iñaki Alegria Loinaz (coord.)
- Julio Villena Román (coord.)
Editorial: Sociedad Española para el Procesamiento del Lenguaje Natural
ISBN: 978-84-695-8349-4
Año de publicación: 2013
Páginas: 72-75
Congreso: Sociedad Española para el Procesamiento del Lenguaje Natural. Congreso (29. 2013. Madrid)
Tipo: Aportación congreso
Resumen
Este artículo presenta el sistema de normalización de tweets desarrollado por el grupo SINAI. Realizamos una serie de conversiones a partir de lexicones de traducción y un corrector ortográfico. Nuestro sistema obtiene un resultado de accuracy bajo, un 37.6%, y analizando los resultados necesita mejorarse en varios aspectos tales como diminutivos y superlativos, tratamiento de entidades o abreviaturas.