Binary classifiers versus AdaBoost for labeling of digital documents

  1. Montejo Ráez, Arturo
  2. Ureña López, Luis Alfonso
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2006

Número: 37

Páginas: 319-326

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

La asignación de términos de un vocabulario controlado (habitualmente un tesauro) a documentos en formato digital está abriendo la puerta a nuevas aplicaciones. En este artículo se comparan dos algoritmos avanzados para clasificación de documentos: la selección adaptativa de clasificadores base binarios y el algoritmo AdaBoost. Si bien ambos mostraron tiempos de respuesta similares, el primero proporcionó los mejores resultados sobre la partición hep-ex del corpus HEP, respaldando dicho método como una solución robusta al multi-etiquetado para grandes colecciones.