SINAI at Twitter-Normalization 2013

  1. Arturo Montejo Ráez 1
  2. M. Carlos Diaz Galiano 1
  3. Eugenio Martínez Cámara 1
  4. M. Teresa Martín Valdivia 1
  5. Miguel A. García Cumbreras 1
  6. L. Alfonso Ureña López 1
  1. 1 Universidad de Jaén
    info

    Universidad de Jaén

    Jaén, España

    ROR https://ror.org/0122p5f64

Llibre:
XXIX Congreso de la Sociedad Española de Procesamiento de Lenguaje Natural: SEPLN 2013
  1. Alberto Díaz Esteban (coord.)
  2. Iñaki Alegria Loinaz (coord.)
  3. Julio Villena Román (coord.)

Editorial: Sociedad Española para el Procesamiento del Lenguaje Natural

ISBN: 978-84-695-8349-4

Any de publicació: 2013

Pàgines: 72-75

Congrés: Sociedad Española para el Procesamiento del Lenguaje Natural. Congreso (29. 2013. Madrid)

Tipus: Aportació congrés

Resum

Este artículo presenta el sistema de normalización de tweets desarrollado por el grupo SINAI. Realizamos una serie de conversiones a partir de lexicones de traducción y un corrector ortográfico. Nuestro sistema obtiene un resultado de accuracy bajo, un 37.6%, y analizando los resultados necesita mejorarse en varios aspectos tales como diminutivos y superlativos, tratamiento de entidades o abreviaturas.