Aportacions en el camp del llinatge geospacial en entorns distribuïtsde la captura a l'explotació

  1. CLOSA SANTOS, GUILLEM
Dirigida por:
  1. Joan Masó Pau Director/a

Universidad de defensa: Universitat Autònoma de Barcelona

Fecha de defensa: 29 de enero de 2021

Tribunal:
  1. Francisco Javier Ariza López Presidente
  2. Anna Badia Perpinyà Secretario/a
  3. Francisco Javier López Pellicer Vocal

Tipo: Tesis

Teseo: 755814 DIALNET lock_openTDX editor

Resumen

El linaje geoespacial se puede definir como aquella parte de los metadatos que describe el origen de los datos (esencialmente fuentes y procesos utilizados). Este tiene una reconocida utilidad en el descubrimiento, análisis de la calidad y en la reproducibilidad de la información geográfica, entre otros beneficios. A pesar de la existencia de literatura científica y de modelos de representación ad hoc, la presencia de información de linaje en los metadatos geoespaciales es en general todavía escasa, y cuando está presente, no es completa. La hipótesis principal de esta tesis doctoral se basa en que la ausencia generalizada de información de linaje dentro de los metadatos geoespaciales actúa como factor limitador en la interoperabilidad y la reproducibilidad de datos, procesos y modelos geoespaciales tanto en entornos científicos como administrativos. Ante este escenario, son necesarias investigaciones que propongan nuevos mecanismos para potenciar una mayor incorporación de la información del linaje en los metadatos geoespaciales. Con este fin, esta tesis doctoral investiga, en primer lugar, las carencias en las fases de representación, captura, almacenamiento y visualización del linaje. En segundo lugar, propone alternativas, tanto a nivel teórico como aplicado, que potencien una mejor descripción del linaje a su vez que incrementen su presencia en los metadatos. Finalmente, plantea metodologías para aumentar su utilidad tanto en el contexto de los Sistemas de Información Geográfica (SIG) como en entornos web distribuidos. Los capítulos 2, 3, 4 y 6 realizan propuestas para mejorar las capacidades de los modelos. En concreto, el capítulo 2 propone una adaptación del modelo W3C PROV (modelo genérico para describir el linaje de todo tipo de información en la web) a las singularidades de la información geográfica y aprovechar sus características para describir el linaje a nivel de conjunto de datos, de elemento geoespacial y de atributo. Los capítulos 3 y 4 proponen el uso combinado de los modelos de linaje incluidos en la ISO 19115-1 y la ISO 19115-2 con el estándar Web Processing Service (WPS) del Open Geospatial Consortium (OGC) para mejorar su completitud. Finalmente, el capítulo 6 enfatiza en la necesidad de representar y relacionar el linaje de distintos conjuntos de datos con el objetivo de maximizar los beneficios que nos aporta. Los capítulos 3 y 4 presentan una herramienta llamada Provenance Engine (PE). La herramienta, implementada en el marco del programa de SIG y Teledetección MiraMon, captura automáticamente el linaje de las ejecuciones realizadas con el programa. Herramientas que faciliten la interpretación del linaje son necesarias y tienen un impacto directo en su comprensión y uso. En este sentido, el MiraMon permite visualizar el linaje como una secuencia de procesos. Cada proceso tiene una lista indentada con todos los parámetros utilizados y las salidas generadas. Además, el capítulo 6 presenta un sistema alternativo que proporciona y renderiza la información de linaje como un grafo en un entorno distribuido. En último lugar, se ha trabajado para generar propuestas que incrementen la utilidad del linaje y aporten valor añadido a su uso. El capítulo 5 establece las bases teóricas para realizar consultas sobre la información del linaje de datos de teledetección con el objetivo de recibir sólo aquellos fragmentos de datos o procesos que nos pueden interesar en un momento determinado. Finalmente, el capítulo 6 amplía y complementa el capítulo 5. En concreto, presenta el diseño de un sistema de consultas insertado en un navegador de mapas. El sistema permite presentar la información de linaje de distintos conjuntos de datos incluidos en el navegador en una sola vista, ver las interacciones y hacer comparaciones de los flujos que han dado lugar a los distintos conjuntos de datos.