Distance Metric Learning for Explainability in Complex Problems
- Suárez Díaz, Juan Luis
- Salvador García López Codirector
- Francisco Herrera Triguero Codirector/a
Universidad de defensa: Universidad de Granada
Fecha de defensa: 09 de enero de 2024
- Pedro González Garcia Presidente/a
- Alberto Fernández Hilario Secretario
- María José del Jesús Díaz Vocal
- Javier del Ser Lorente Vocal
- Daniel Peralta Cámara Vocal
Tipo: Tesis
Resumen
Los grandes avances tecnológicos de los últimos años han traído consigo la generación de grandes cantidades de datos, de los cuales se puede extraer información relevante para numerosos campos, como la ciencia, los negocios o la comunicación, si se procesan y analizan adecuadamente. El aprendizaje automático, englobado dentro del proceso conocido como knowledge discovery in databases, surge como disciplina centrada en el estudio de técnicas que permitan que las máquinas puedan aprender a partir de los datos, en el sentido de reconocer patrones o hacer inferencia sobre datos no vistos previamente. Dentro del aprendizaje automático, hay una rama de algoritmos denominados de aprendizaje basados en semejanza, que se inspiran en uno de los mecanismos más potentes del aprendizaje humano: el reconocimiento de objetos basado en la similitud con otros objetos previamente vistos. Estos algoritmos requieren de una medida de distancia o de similitud entre los datos, que permita determinar cómo de parecidos son cualesquiera dos ejemplos de los que se disponga. Esta medida de distancia o similitud es crucial para el correcto funcionamiento de estos algoritmos, ya que de ella depende la calidad de los resultados que se obtengan. En esta tesis se aborda el problema del aprendizaje de métricas de distancia, que consiste en aprender las medidas de distancia o similitud a partir de los propios datos, de forma que puedan ser empleadas posteriormente en algoritmos de aprendizaje por semejanza de forma exitosa. En concreto, se afronta el estudio y desarrollo de algoritmos de aprendizaje de distancias y su aplicación en problemas novedosos o poco comunes del aprendizaje automático, más allá de los problemas clásicos de clasificación o regresión. Esta tesis aborda los siguientes objetivos: 1. En primer lugar, se propone abordar el estudio del aprendizaje de distancias y sus algoritmos tanto de un punto de vista teórico como experimental. Para ello, se plantea el desarrollo de una librería software con los algoritmos más destacados de la disciplina, y un tutorial que incluya una revisión teórica, un estudio experimental y un análisis de resultados de los mismos. 2. El segundo objetivo plantea el desarrollo de nuevos algoritmos de aprendizaje de distancias para problemas no convencionales o singulares, es decir, problemas del aprendizaje automático que se salen de los estándares clásicos de clasificación o regresión. Para cumplir con este objetivo, se han desarrollado tres algoritmos de aprendizaje de distancias, propuestos por primera vez en esta tesis, que abordan tres problemas singulares diferentes: clasificación desbalanceada, ordinal y monotónica. 3. El tercer objetivo se centra en el aprendizaje de distancias profundo. En los últimos años, el aprendizaje profundo ha revolucionado el campo del aprendizaje automático, y esa revolución también ha llegado al aprendizaje de distancias. El aprendizaje de distancias profundo propone nuevos modelos para aprender distancias que abren un nuevo abanico de posibilidades en este área. Además, estos métodos han demostrado ser efectivos en algunos de los problemas más desafiantes del aprendizaje profundo, como aquellos en los que se dispone de pocos datos. Esta tesis incorpora una propuesta de modelo de aprendizaje de distancias profundo aplicada a un problema de procesamiento del lenguaje natural con escasez de datos. 4. El cuarto objetivo es transversal y plantea el análisis de la explicabilidad de los modelos desarrollados, apoyándose en las características explicables de los algoritmos de aprendizaje por semejanza, y en cómo aprender una distancia influye a dichas características. 5. Por último, se plantea la especialización de las propuestas desarrolladas para su aplicación en problemas reales. Esto se aborda conjuntamente con el tercer objetivo en el problema de procesamiento del lenguaje natural tratado. La tesis aborda con éxito los objetivos enumerados, dejando así aportaciones destacables en el campo del aprendizaje de métricas de distancia. Con la librería software desarrollada y el tutorial se proporciona una base sólida para comprender el estado del arte del aprendizaje de métricas de distancia tradicional, y un punto de partida para iniciarse en la disciplina de forma práctica. Los algoritmos propuestos en el segundo objetivo proporcionan nuevas perspectivas para abordar problemas menos habituales del aprendizaje automático, y los modelos de aprendizaje de distancias profundo desarrollados en el tercer objetivo muestran el potencial de combinar aprendizaje profundo y aprendizaje de distancias, siendo aplicados además en un caso de estudio real, abordando así el quinto objetivo. Por último, el estudio de la explicabilidad propuesto en el cuarto objetivo analiza, para uno de los algoritmos desarrollados, cómo el aprendizaje de distancias puede influir en la explicabilidad del modelo resultante.