Detección automática de spam utilizando regresión logística bayesiana

  1. Ortiz Martos, Antonio Jesús
  2. Martín Valdivia, María Teresa
  3. Ureña López, Luis Alfonso
  4. García Cumbreras, Miguel Ángel
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2005

Número: 35

Páginas: 127-133

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Este artículo presenta un sistema de detección automática de Spam, o correo no deseado, aplicando Regresión Logística Bayesiana (BBR) como técnica de aprendizaje automático, sobre la colección de correos electrónicos PAMBASE. A modo de comparativa se han aplicado otros dos algoritmos de aprendizaje: el algoritmo SVM (Support Vector Machine), y el algoritmo PLAUM (Perceptron Algorithm with Uneven Margins). La finalidad de este estudio es comprobar la eficiencia y efectividad del algoritmo BBR en la tarea concreta de filtrado de Spam. Como muestran los experimentos, el algoritmo BBR no solo obtiene unos resultados satisfactorios en cuanto a precisión y recall, sino que además es el algoritmo más rápido de los estudiados