Text categorization using bibliographic recordsbeyond document content

  1. Montejo Ráez, Arturo
  2. Ureña López, Luis Alfonso
  3. Steinberger, Ralf
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2005

Número: 35

Páginas: 119-126

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este artículo se estudia el uso de diferentes fuentes de información para tareas de clasificación de textos. Dado el creciente número de bibliotecas digitales, se impone una revisión de la información disponible en dichas bases de datos. Se han llevado a cabo una serie de experimentos de clasificación multi-etiquetado dentro del dominio de la Física de Altas Energías haciendo uso de diferentes clasificadores base y combinando distintas fuentes de formación. Los resultados muestran que el uso de metadatos es tan válido como el uso de versiones a texto completo de los documentos