Nuevos métodos para el procesamiento y análisis de información geográfica
- Vázquez Rodríguez, Romel
- Juan Carlos Torres Cantero Director/a
Universitat de defensa: Universidad de Granada
Fecha de defensa: 30 de de novembre de 2015
- Francisco Feito Higueruela President
- Domingo Martín Perandrés Secretari/ària
- Mercedes Farjas Abadía Vocal
- José Parets Llorca Vocal
- José Ojeda Zújar Vocal
Tipus: Tesi
Resum
Resumen La geovisualización es un campo multidisciplinario que involucra la cartografía, la visualización científica, el análisis de imágenes, la visualización de información, el análisis exploratorio de datos y la ciencia de los sistemas de información geográfica con el objetivo de proporcionar la teoría, los métodos y las herramientas para la exploración visual, el análisis, la síntesis y la presentación de datos que contengan información geográfica. En este trabajo se ha creado un modelo que permite integrar herramientas de visualización en sistemas de información geográfica para el análisis de grandes volúmenes de datos espacio-temporales, brindando la posibilidad de analizar simultáneamente múltiples variables geo-referenciadas, que pueden representar series temporales. Este modelo se llevó a cabo mediante el desarrollo de herramientas para el análisis exploratorio de datos con baja y alta densidad espacial, incorporando en este último caso la manipulación de formatos de datos científicos. El análisis exploratorio de datos con baja densidad espacial fue tratado como un caso especial que permite analizar visualmente datos multiparamétricos de manera independiente o coordinada asociados a pocos lugares del espacio. Se obtuvo una herramienta con múltiples técnicas de visualización de datos multiparamétricos que fueron integradas como una extensión de la versión 1.9 de gvSIG. Se presentó un caso de estudio con datos climáticos de la provincia de Villa Clara, Cuba. Se aplicó el modelo propuesto para el análisis exploratorio de datos con alta densidad espacial y se obtuvo una herramienta que permite la extracción de conocimiento, reconocimiento de patrones, tendencias, anomalías y relaciones entre múltiples variables distribuidas uniformemente sobre un territorio. Se propuso la integración de un conjunto de técnicas de visualización de datos multiparamétricos en la versión 1.12 de gvSIG. Se desarrollaron un conjunto de herramientas y algoritmos que permiten la manipulación de los formatos de datos científicos HDF y netCDF en sistemas de información geográfica. Estos fueron implementados como una extensión de la biblioteca Sextante, por lo que pueden ser utilizadas en cualquier sistema de información geográfica basado en Java que permita la integración de esta biblioteca. La extensión desarrollada en Sextante es de gran utilidad para la transformación de formatos de datos comunes en los sistemas de información geográfica para formatos de datos científicos y viceversa. Además, algunos de los algoritmos están diseñados para facilitar la creación automática de conjuntos de datos con la estructura necesaria que requiere el módulo de visualización científica de gvSIG 1.12. Se demostró el uso de las herramientas desarrolladas mediante un caso de estudio que evidencia su utilidad para crear grandes conjuntos de datos que pueden ser analizados mediante visualizaciones en sistemas de información geográfica. En la tesis aplicó el método de expertos para realizar una validación de las propuestas realizadas en esta tesis. Mediante los casos de estudio descritos en el trabajo y la valoración de los expertos se ha comprobado la viabilidad de la utilización del modelo para desarrollar herramientas que permiten la extracción de conocimiento, reconocimiento de patrones, tendencias, anomalías y relaciones entre múltiples variables en diferentes áreas de aplicación. En particular se obtuvo una valoración positiva sobre la contribución de la integración de técnicas de visualización de datos multiparamétricos en sistemas de información geográfica para el análisis exploratorio de grandes volúmenes de datos científicos. Descripción del resultado La geovisualización es un campo emergente que se basa en la integración de muchas disciplinas, como la cartografía, la visualización científica, el análisis de imágenes, la visualización de información, el análisis exploratorio de datos y la ciencia de los sistemas de información geográfica con el objetivo de proporcionar la teoría, los métodos y las herramientas para la exploración visual, el análisis, la síntesis y la presentación de datos que contengan información geográfica (Dykes et al., 2005, Kraak, 2006, MacEachren and Kraak, 2001). El uso de sistemas de información geográfica ha llegado a ser esencial en todos los campos relacionados con la geografía y el medio ambiente, ha pasado por las aplicaciones más clásicas de cartografía, urbanismo y gestión de recursos. Actualmente se utilizan los sistemas de información geográfica para resolver problemas tan diversos como la planificación de la extinción de incendios, el análisis de riesgos ambientales o la propagación de contaminantes. Un sistema de información geográfica integra equipamiento de cómputo, programas y bases de datos geográficas para captar y mostrar en diferentes formas la información geográfica necesaria para resolver problemas de alta complejidad en los procesos de planificación y gestión. Así mismo, se han convertido en herramientas de trabajo muy útiles para realizar consultas de manera interactiva, y procesar y analizar la información espacial. Permiten además, la edición de datos y mapas para presentar los resultados de múltiples análisis (Bolstad, 2005). Según (Bolstad, 2005) un sistemas de información geográfica es una integración organizada de hardware, software y datos geográficos diseñado para capturar, almacenar, manipular, analizar y desplegar en todas sus formas la información geográficamente referenciada, con el fin de resolver problemas complejos de planificación y gestión. En un sentido más genérico, los sistemas de información geográfica son herramientas que permiten a los usuarios crear consultas de manera interactiva, analizar la información espacial, editar diferentes tipos de datos, mapas y presentar los resultados de todas estas operaciones (Bolstad, 2005). Por otra parte, la visualización científica y la minería visual de datos se han convertido en áreas de investigación de creciente interés en los últimos años, motivado fundamentalmente por el incremento constante de los volúmenes de datos generados en muchos campos de aplicación (por ejemplo, Geología, Geofísica, Meteorología, entre otros), así como por el aumento sostenido de la potencia de las interfaces gráficas modernas, las cuales permiten generar imágenes cada vez más sofisticadas. En las últimas dos décadas se han realizado avances significativos en el establecimiento de la visualización como una herramienta de exploración de datos flexible y fácil de usar. El análisis visual de datos es un nuevo enfoque, que se beneficia de las bondades de la percepción humana para la interpretación de imágenes, así como de los métodos computacionales automáticos, lo que permite una mejor comprensión y análisis de grandes y complejos conjuntos de datos (Keim et al., 2008, Keim et al., 2010). La visualización científica se ocupa de encontrar una representación visual apropiada para un conjunto de datos, que permita mayor efectividad en el análisis y evaluación de los mismos. Según (Rhyne, 1997) posibilita la transformación de los datos numéricos o simbólicos y la información en imágenes geométricas generadas por computadora. Es una metodología para interpretar, a través de una imagen en la computadora, tanto datos de mediciones como los generados por modelos computacionales (Rhyne, 1997). La investigación y el desarrollo de la visualización científica se han centrado en cuestiones relacionadas con el renderizado de gráficos en tres dimensiones, animaciones de series temporales y visualización interactiva en tiempo real (Rhyne and MacEachren, 2004). Una aplicación de la minería visual de datos, es que se está convirtiendo aceleradamente en una herramienta de apoyo para el modelado y simulación de procesos. El reto aquí es lograr una forma de análisis efectiva, que mediante la visualización de datos de simulaciones pueda servir para la creación y validación de hipótesis, así como la investigación sobre la estructura de modelos. Esto permite una valoración de los datos antes de ejecutar costosos experimentos. La integración de técnicas de visualización científica en sistemas de información geográfica es una idea innovadora, que combina las ventajas y fortalezas para el análisis de datos de los dos enfoques. Esta es un área de investigación interesante dentro de la geovisualización. La integración de visualizaciones de grandes volúmenes de datos espaciales y temporales facilita la comprensión de múltiples problemas que afectan a la sociedad (Andrienko et al., 2003). El mundo real no es estático, tanto componentes espaciales como no espaciales tienen que ver con el tiempo (Hogeweg, 2000). Especialistas de muchas áreas de la ciencia visualizan, consultan y analizan la información recopilada a partir del mundo real para ayudar a la toma de decisiones. Esta información existe en los dominios espacial, temporal y temático (Hogeweg, 2000). El dominio espacial es el encargado de analizar qué se mide o se encuentra en algún lugar. El dominio temporal se encarga de analizar qué se produce en algún momento o qué existe durante un cierto tiempo. El dominio temático es el que tiene que ver con el área de aplicación que se va a analizar en el espacio y el tiempo (Hogeweg, 2000). Una de las ciencias que mejor se ajusta a la integración de los dominios espacial, temporal y temático es la meteorología. Históricamente el análisis espacio-temporal en esta área se ha realizado mediante el uso de sistemas de información geográfica, herramientas para el análisis de series temporales, paquetes estadísticos, geoestadísticos y la animación en sistemas de visualización. Propuesta A partir del objeto de estudio de esta investigación, que es el análisis visual de grandes volúmenes de datos espacio-temporales, se puede definir que el fin y los objetivos del modelo propuesto es facilitar y guiar el desarrollo de herramientas de software para el análisis visual de grandes volúmenes de datos espacio-temporales, mediante la integración de técnicas de visualización científica y sistemas de información geográfica. Como consecuencia, la primera prioridad está en el diseño de herramientas de nuevo tipo que permitan realizar análisis mediante visualizaciones más intuitivas, e interactivas, y brinden la posibilidad de manipular grandes volúmenes de datos y gestionar múltiples vistas de estos de forma simultánea, teniendo en cuenta sus características espacio-temporales. El apoyo al usuario en la especificación de problemas analíticos y la determinación de las técnicas de visualización adecuadas proporcionará un nivel superior de análisis en este objeto de estudio. En este trabajo se ha creado un modelo que permite integrar herramientas de visualización en sistemas de información geográfica para el análisis de grandes volúmenes de datos espacio-temporales, brindando la posibilidad de analizar simultáneamente múltiples variables geo-referenciadas, que pueden representar series temporales. Este modelo se llevó a cabo mediante el desarrollo de herramientas para el análisis exploratorio de datos con baja y alta densidad espacial, incorporando en este último caso la manipulación de formatos de datos científicos. Para el desarrollo del modelo se han definido cada uno de los componentes que tiene un modelo siguiendo la metodología de (Valle-Lima, 2012). Como resultado de la utilización de este modelo, cumpliendo los principales principios propuestos y trabajando con elementos de la caracterización del campo de acción se siguieron las estrategias y formas de implementación del modelo, alcanzando los resultados siguientes: - Una herramienta de software con múltiples técnicas de visualización de datos multiparamétricos que fueron integradas como una extensión de la versión 1.9 de gvSIG. La herramienta fue utilizada para resolver el problema del análisis exploratorio de datos con baja densidad espacial. La herramienta permite analizar visualmente datos multiparamétricos de manera independiente o coordinada asociados a pocos lugares del espacio. Se presentó un caso de estudio con datos climáticos de la provincia de Villa Clara, Cuba. - Una herramienta de software que permite la extracción de conocimiento, reconocimiento de patrones, tendencias, anomalías y relaciones entre múltiples variables distribuidas uniformemente sobre un territorio. Esta herramienta fue utilizada para la solución al problema del análisis exploratorio de datos con alta densidad espacial. En este caso se propuso la integración de un conjunto de técnicas de visualización de datos multiparamétricos en la versión 1.12 de gvSIG. - Un conjunto de herramientas y algoritmos que permiten la manipulación de los formatos de datos científicos HDF y netCDF en sistemas de información geográfica. Estos fueron implementados como una extensión de la biblioteca Sextante, por lo que pueden ser utilizadas en cualquier sistema de información geográfica basado en Java que permita la integración de esta biblioteca. La extensión desarrollada en Sextante es de gran utilidad para la transformación de formatos de datos comunes en los sistemas de información geográfica para formatos de datos científicos y viceversa. Además, algunos de los algoritmos están diseñados para facilitar la creación automática de conjuntos de datos con la estructura necesaria que requiere el módulo de visualización científica de gvSIG 1.12. Se demostró el uso de las herramientas desarrolladas mediante un caso de estudio que evidencia su utilidad para crear grandes conjuntos de datos que pueden ser analizados mediante visualizaciones en sistemas de información geográfica. - Un caso de estudio integrador donde se han utilizado las herramientas desarrolladas para estudiar los tipos de clima en la península ibérica. Se comprobó la utilidad de los métodos y herramientas desarrollados para el análisis visual de grandes volúmenes de datos climáticos. Se estudiaron los tipos de clima de la península ibérica y se mostraron ejemplos que evidencian los contrastes, y resaltan propiedades poco estudiadas sobre los subtipos de clima de la península. - Validación de los métodos propuestos en la tesis mediante casos de estudio y criterios de expertos. Durante el desarrollo de la presente investigación se obtuvieron los resultados que se muestran a continuación. Artículos en revistas: - Vázquez-Rodríguez, Romel; Pérez-Risquet, Carlos; y Torres, Juan Carlos. 2015. Exploratory data analysis through the integration of visualization techniques in geographical information systems, Revista Técnica de la Facultad de Ingeniería de la Universidad del Zulia, 38(1), 73-82. ISSN:0254-0770, factor de impacto (2014): 0.047, SJR: 0.12. - Vázquez-Rodríguez, Romel; Pérez-Risquet, Carlos; y Torres, Juan Carlos. 2013. A novel visual data mining module for the geographical information system gvsig, Anuário do Instituto de Geociências, 36(1), 98-111. ISSN:0101-9759, SJR: 0.25. Trabajos presentados en congresos por el autor de la tesis: - Uso de sistemas de información geográfica basados en software libre para la visualización de datos meteorológicos. Informática 2009. Cuba. - Estudio de la factibilidad de la aplicación de técnicas de visualización de datos multiparamétricos para el análisis visual de datos meteorológicos. CompuMat 2009. Cuba. - Visualización de datos meteorológicos mediante técnicas de visualización científica en SIG. Seminario Internacional de Doctorado en Soft Computing. Cuba. - Implementation of scientific visualization techniques for meteorological visual data in GIS. Cuba-Flanders Workshop on Machine Learning and Knowledge Discovering CFWMLKD 2010. Cuba. - A new visual data mining tool for gvSIG GIS. International Conference on Knowledge Discovery and Information Retrieval. KDIR 2010. España. - Herramientas de visualización para el análisis visual de datos espacio-temporales en gvSIG. Informática 2011. Cuba. - Visualización Espacio-Temporal mediante técnicas de visualización de datos multiparamétricos en SIG. Geociencias 2011. Cuba. - Extensión del módulo de visualización de datos espacio-temporales de gvSIG. Informática 2013. Cuba. - A framework for the visualization and analysis of environmental and climatic temporal sequences evenly distributed in space and time. Workshop and Annual Meeting of the DAAD funded Network "Developing Sustainability". 2013. Indonesia. - Un nuevo método para el análisis visual de grandes volúmenes de datos espacio-temporales. Geociencias 2015. Cuba. - Algoritmos para la manipulación de formatos de datos científicos en gvSIG. Geociencias 2015. Cuba. Premios y condecoraciones obtenidas por el autor de la tesis durante la formación doctoral: - Premio Anual Provincial de la Academia de Ciencias de Cuba. 2011. Herramientas y técnicas para la visualización científica en sistemas de información geográfica. - Título de experto universitario en sistemas de información geográfica, otorgado por la Universidad Internacional de Andalucía. 2012. - Premio Anual Provincial de la Academia de Ciencias de Cuba. 2013. Integración de técnicas de visualización de datos en sistemas de información geográfica. - Premio Nacional 2014 "Gustavo Furrazola Bermúdez". Otorgado por la Sociedad Cubana de Geología a jóvenes destacados en la investigación en las Geociencias. Referencias bibliográficas del resumen. ANDRIENKO, N., ANDRIENKO, G. & GATALSKY, P. 2003. Exploratory spatio-temporal visualization: an analytical review. Journal of Visual Languages and Computing 14, 503-541. BOLSTAD, P. 2005. GIS fundamentals: A first text on geographic information systems, Eider Pr. DYKES, J., MACEACHREN, A. & KRAAK, M. 2005. Exploring Geovisualization, Chapter 1. Exploring geovisualization. Amsterdam: Elsevier. HOGEWEG, M. 2000. Spatio-temporal visualisation and analysis Master of Science in Geographical Information Systems University of Salford KEIM, D., MANSMANN, F., SCHNEIDEWIND, J., THOMAS, J. & ZIEGLER, H. 2008. Visual analytics: Scope and challenges. Visual Data Mining, 76-90. KEIM, D. A., KOHLHAMMER, J., ELLIS, G. & MANSMANN, F. 2010. Mastering The Information Age-Solving Problems with Visual Analytics, Goslar, Germany, Eurographics Association. KRAAK, M. 2006. Visualization viewpoints: beyond geovisualization. IEEE Computer Graphics and Applications, 26, 6-9. MACEACHREN, A. & KRAAK, M. 2001. Research challenges in geovisualization. Cartography and Geographic Information Science Special Issue on Geovisualization, 28, 80. RHYNE, T. M. 1997. Going virtual with Geographic Information and Scientific Visualization Computers & Geosciences, 23, 489 - 491. RHYNE, T. M. & MACEACHREN, A. 2004. Visualizing Geospatial Data. Topic #1: Overview of Integrating Geospatial with Visualuzation ACM SIGGRAPH 2004 Course #30. VALLE-LIMA, A. D. 2012. La investigación pedagógica. Otra mirada, Pueblo y Educación.