SINAI at Twitter-Normalization 2013
- Arturo Montejo Ráez 1
- M. Carlos Diaz Galiano 1
- Eugenio Martínez Cámara 1
- M. Teresa Martín Valdivia 1
- Miguel A. García Cumbreras 1
- L. Alfonso Ureña López 1
-
1
Universidad de Jaén
info
- Alberto Díaz Esteban (coord.)
- Iñaki Alegria Loinaz (coord.)
- Julio Villena Román (coord.)
Éditorial: Sociedad Española para el Procesamiento del Lenguaje Natural
ISBN: 978-84-695-8349-4
Année de publication: 2013
Pages: 72-75
Congreso: Sociedad Española para el Procesamiento del Lenguaje Natural. Congreso (29. 2013. Madrid)
Type: Communication dans un congrès
Résumé
Este artículo presenta el sistema de normalización de tweets desarrollado por el grupo SINAI. Realizamos una serie de conversiones a partir de lexicones de traducción y un corrector ortográfico. Nuestro sistema obtiene un resultado de accuracy bajo, un 37.6%, y analizando los resultados necesita mejorarse en varios aspectos tales como diminutivos y superlativos, tratamiento de entidades o abreviaturas.