Text categorization using bibliographic recordsbeyond document content
- Montejo Ráez, Arturo
- Ureña López, Luis Alfonso
- Steinberger, Ralf
ISSN: 1135-5948
Año de publicación: 2005
Número: 35
Páginas: 119-126
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
En este artículo se estudia el uso de diferentes fuentes de información para tareas de clasificación de textos. Dado el creciente número de bibliotecas digitales, se impone una revisión de la información disponible en dichas bases de datos. Se han llevado a cabo una serie de experimentos de clasificación multi-etiquetado dentro del dominio de la Física de Altas Energías haciendo uso de diferentes clasificadores base y combinando distintas fuentes de formación. Los resultados muestran que el uso de metadatos es tan válido como el uso de versiones a texto completo de los documentos