Deep learning models for pistol detection in videos

Olmos Pimentel, Roberto

Deep learning models for pistol detection in videos

Olmos Pimentel, Roberto

Dirigida por:

Siham Tabik Director/a
Francisco Herrera Triguero Codirector/a

Universidad de defensa: Universidad de Granada

Fecha de defensa: 05 de diciembre de 2019

Tribunal:

Juan Manuel Górriz Sáez Presidente/a
Julián Luengo Martín Secretario/a
Isabelle Claude Hupont Torres Vocal
Juan Mario Haut Hurtado Vocal
Francisco Charte Ojeda Vocal

Tipo: Tesis

Teseo: 606474 DIALNET

Resumen

Las armas, son herramientas que tienen como objetivo atacar y producir algún daño, siendo este daño en la mayoría de las ocasiones, daño físico. El riesgo que representa su uso varía dependiendo de la actividad para la que son empleadas, mientras que existen usos que generan beneficios para la sociedad, un gran porcentaje de las armas son empleadas para actividades criminales. El mal uso de las armas representa un severo problema en la actualidad, por la amplia disponibilidad de las armas en la mayoría de los países del mundo. El mayor riesgo de entre todas las armas, lo presentan las armas de fuego, estas tienen la capacidad de generar grandes daños en un corto periodo de tiempo con mínima experiencia en su uso. La facilidad de uso de las armas de fuego provoca que no solo sean peligrosas en actividades criminales, sino también en la vida cotidiana por activaciones accidentales. Poniendo en perspectiva el riesgo que representan las armas de fuego, en Estados Unidos de América en el 2017 se estima que hubo 39,773 muertes relacionadas con ellas. Mientras que el uso de las armas de fuego es asunto de debate en diversos puntos del mundo sin llegar a grandes consensos, la realidad es que el monitoreo y control de las armas de fuego es fundamental para prevenir riesgos y salvar vidas. Contar con medios que permitan detectar las armas de fuego en todo momento y prevenir su uso es una necesidad de la actualidad. En esta tesis se estudia el desarrollo de sistemas para la detección de armas de fuego (particularmente pistolas) basados en el uso de cámaras de vídeo y en la tecnología de redes neuronales artificiales. Las redes neuronales artificiales en la actualidad permiten realizar detecciones confiables en tiempos de milisegundos que hacen posible el emplearlas en diversas aplicaciones en tiempo real. Durante este trabajo se analizarán diversos diseños de redes neuronales y se harán las adecuaciones necesarias para afrontar el reto de detectar objetos tan variables como lo son las pistolas. En particular, en esta tesis se presentan los resultados de un continuo análisis del problema de detección de armas y se anexan dos publicaciones en revistas indexadas del primer cuartil, con la recopilación de parte de los resultados del trabajo realizado. El objetivo final de esta tesis es el desarrollar un modelo robusto, preciso y rápido de detección de pistolas haciendo uso de redes neuronales, los objetivos particulares marcados para alcanzar ese objetivo son los siguientes: • Diseñar una base de datos que permita entrenar modelos de alta calidad, capaces de realizar detecciones de pistolas. • Desarrollar detectores basados en redes neuronales convolucionales que proporcionen detecciones robustas y precisas de pistolas en tiempo real en vídeo. • Hacer uso de técnicas de fusión de la información y redes neuronales para mejorar el desempeño de los detectores desarrollados. • Emplear la información temporal presente en los vídeos para mejorar la estabilidad de la detección de armas. • Examinar el uso de sistemas de confirmación de resultados al final de los detectores, para mejorar el resultado de la detección. Como resultado del trabajo de esta tesis doctoral se han generado tres sistemas funcionales de detección de armas en video: 1. El primer sistema es un detector basado en el empleo de la técnica de detección de objetos en imágenes Faster R-CNN, el cual consigue muy buenos resultados. 2. El segundo sistema propuesto es un sistema que emplea detectores como los propuestos en el primer sistema combinados con un sistema de fusión de información basado en el empleo de imágenes provenientes de dos cámaras a la vez. El sistema de fusión de la información diseñado dota al detector con la capacidad de emplear información espacial para mejorar la calidad de la detección. El sistema logra disminuir los errores en la detección de pistolas por propuesta de regiones, disminuyendo el número de falsos positivos considerablemente. 3. El tercer sistema emplea una nueva técnica basada en LSTMs y la combinación de detectores basados en Faster R-CNN y Single Shot Detector (SSD)para reducir los errores del sistema. El empleo de LSTMs permite al sistema realizar un seguimiento a través del tiempo de la posición de la pistola detectada, lo cual proporciona una mayor estabilidad y fiabilidad a la detección. Por el otro lado el empleo de un detector basado en SSD permite el incluir una etapa ligera y rápida de confirmación al resultado de la detección lo que lleva a la creación de un modelo de detección de pistolas más estable y con menos errores de detección. Finalmente, en esta tesis también se hace un estudio de la viabilidad de emplear estos detectores en dispositivos de Edge computing en tiempo real, buscando identificar las limitaciones existentes en estos dispositivos y las oportunidades que presenta el empleo de detectores de armas de fuego en estos dispositivos. El resultado de este trabajo está avalado por dos publicaciones en revistas del primer cuartil.