Binary classifiers versus AdaBoost for labeling of digital documents
ISSN: 1135-5948
Año de publicación: 2006
Número: 37
Páginas: 319-326
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
La asignación de términos de un vocabulario controlado (habitualmente un tesauro) a documentos en formato digital está abriendo la puerta a nuevas aplicaciones. En este artículo se comparan dos algoritmos avanzados para clasificación de documentos: la selección adaptativa de clasificadores base binarios y el algoritmo AdaBoost. Si bien ambos mostraron tiempos de respuesta similares, el primero proporcionó los mejores resultados sobre la partición hep-ex del corpus HEP, respaldando dicho método como una solución robusta al multi-etiquetado para grandes colecciones.