Human Being Language-Based Rule Extensions for Interpretable and Transparent Data Modeling

Biedma Rodríguez, Carmen

Human Being Language-Based Rule Extensions for Interpretable and Transparent Data Modeling

Biedma Rodríguez, Carmen

Dirigida por:

Jesús Alcalá Fernández Codirector
María José Gacto Colorado Codirectora

Universidad de defensa: Universidad de Granada

Fecha de defensa: 03 de julio de 2023

Tribunal:

Carmen Martínez Cruz Presidenta
Carlos Gustavo Porcel Gallego Secretario
Marta Galende Hernández Vocal

Tipo: Tesis

Teseo: 806313 DIALNET DIGIBUG editor

Resumen

La Inteligencia Artificial (IA) ha experimentado en los últimos años un gran auge debido a la capacidad predictiva de los modelos generados. Sin embargo, los avances que se han logrado han generado preocupación por la falta de transparencia y aplicabilidad en la toma de decisiones de los sistemas de IA, lo que se conoce como “problema de la caja negra”. Esta falta de transparencia y aplicabilidad es especialmente preocupante en ámbitos de alto riesgo, como la salud, donde las decisiones basadas en los sistemas de IA pueden tener un impacto significativo en la vida de las personas. Por ello, la Unión Europea ha desarrollado una propuesta de Ley para la IA y ha establecido unas directrices para promover un desarrollo fiable, que garantice una IA legal, ética y robusta https://artificialintelligenceact.eu. Para que las personas puedan depositar su confianza en los sistemas de IA y aprovechar plenamente todos los beneficios que ofrecen, es fundamental que tanto la tecnología en si, como las personas y los procesos involucrados, sean fiables y transparentes. Entre los mecanismos disponibles para desarrollar una IA fiable se encuentra el campo de investigación de la IA explicable (conocido por las siglas en ingles XAI, “eXplainable Artificial Intelligence”). La XAI fomenta el uso y desarrollo de técnicas de IA y de Machine Learning (ML) que proporcionen modelos fácilmente entendibles por los humanos o el uso de técnicas post-hoc que nos faciliten explicaciones de como un modelo complejo realiza sus predicciones y que características del problema está considerando. Entre ellos, el aprendizaje de Sistemas Basados en Reglas Difusas (SBRDs) ha sido ampliamente utilizado para modelar una gran cantidad de problemas. Los modelos generados por estos sistemas son transparentes y comprensibles por sí mismos, ya que constan de un conjunto de reglas simples del tipo “Si-Entonces” formuladas verbalmente sobre dominios imprecisos. Sin embargo, estos métodos suelen constar de un gran número de reglas (cobertura) que suelen contener un gran número de variables (especificidad). Un aumento de la cobertura y la especificidad del modelo suele suponer una mejora de su precisión pero compromete la intención de utilizar estos modelos para que el usuario pueda analizarlos y comprenderlos. Una forma directa de abordar este problema es mediante la sinergia positiva que existe entre los SBRDs y los Algoritmos Evolutivos (AE), conocidos como Sistemas Difusos Evolutivos (SDEs). Los SDEs pueden preservar la esencia original de la comprensibilidad de los sistemas difusos y mejorar su capacidad predictiva al ser capaz de considerar la transparencia y comprensibilidad del modelo en el proceso de aprendizaje. Debido a ello, el objetivo general de esta tesis consiste en diseñar y desarrollar nuevos métodos evolutivos que, haciendo uso de extensiones o de nuevas representaciones de reglas difusas, nos permitan obtener SBRDs precisos, transparentes y comprensibles por los humanos para distintos tipos de problemas (clasificación, regresión y descubrimiento de conocimiento). Para ello, en primer lugar, en esta tesis se ha propuesto una extensión dela representación clásica de regla difusa que permite representar dependencias positivas y negativas para realizar un aprendizaje evolutivo de clasificadores asociativos con un buen equilibrio entre complejidad y precisión. Por otro lado, se ha presentado una nueva extensión de los SBRDs específicamente diseñada para problemas de regresión, combinando una nueva gramática difusa lingüística y una nueva extensión lineal interpretable para obtener el mayor nivel de transparencia posible. Además, se ha propuesto un nuevo algoritmo evolutivo multi-objetivo basado en ´arboles de decisión, que hace uso de la nueva representación de reglas difusas y que permite obtener represores con un buen equilibrio entre precisión y transparencia. Por ´último, se ha presentado una nueva extensión de la representación de reglas de asociación difusas haciendo uso de la nueva gramática difusa lingüística propuesta para regresión. A partir de esta extensión, se ha diseñado una variante de un método clásico de extracción de reglas de asociación difusas para extraer reglas que utilicen la nueva representación de regla. Las reglas obtenidas permiten resumir parte de la información obtenida con la estructura de regla original e identificar relaciones nuevas que no pueden ser representadas con la gramática clásica. Además, la transparencia de los modelos generados para clasificación y regresión ha sido validada sobre un problema real biosanitario relacionado con la obesidad infantil. En este estudio los expertos han podido analizar los modelos y han identificado relaciones interesantes entre las variables, que no se conocían y que actualmente están analizando en laboratorio.