Detección automática de spam utilizando regresión logística bayesiana
- Ortiz Martos, Antonio Jesús
- Martín Valdivia, María Teresa
- Ureña López, Luis Alfonso
- García Cumbreras, Miguel Ángel
ISSN: 1135-5948
Año de publicación: 2005
Número: 35
Páginas: 127-133
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
Este artículo presenta un sistema de detección automática de Spam, o correo no deseado, aplicando Regresión Logística Bayesiana (BBR) como técnica de aprendizaje automático, sobre la colección de correos electrónicos PAMBASE. A modo de comparativa se han aplicado otros dos algoritmos de aprendizaje: el algoritmo SVM (Support Vector Machine), y el algoritmo PLAUM (Perceptron Algorithm with Uneven Margins). La finalidad de este estudio es comprobar la eficiencia y efectividad del algoritmo BBR en la tarea concreta de filtrado de Spam. Como muestran los experimentos, el algoritmo BBR no solo obtiene unos resultados satisfactorios en cuanto a precisión y recall, sino que además es el algoritmo más rápido de los estudiados