Binary classifiers versus AdaBoost for labeling of digital documents

Montejo Ráez, Arturo; Ureña López, Luis Alfonso

Binary classifiers versus AdaBoost for labeling of digital documents

Revista:

Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2006

Número: 37

Páginas: 319-326

Tipo: Artículo

DIALNET GOOGLE SCHOLAR RUA editor

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

La asignación de términos de un vocabulario controlado (habitualmente un tesauro) a documentos en formato digital está abriendo la puerta a nuevas aplicaciones. En este artículo se comparan dos algoritmos avanzados para clasificación de documentos: la selección adaptativa de clasificadores base binarios y el algoritmo AdaBoost. Si bien ambos mostraron tiempos de respuesta similares, el primero proporcionó los mejores resultados sobre la partición hep-ex del corpus HEP, respaldando dicho método como una solución robusta al multi-etiquetado para grandes colecciones.

Fuente de los datos: Dialnet