Aportacions en el camp del llinatge geospacial en entorns distribuïtsde la captura a l'explotació

  1. CLOSA SANTOS, GUILLEM
Zuzendaria:
  1. Joan Masó Pau Zuzendaria

Defentsa unibertsitatea: Universitat Autònoma de Barcelona

Fecha de defensa: 2021(e)ko urtarrila-(a)k 29

Epaimahaia:
  1. Francisco Javier Ariza López Presidentea
  2. Anna Badia Perpinyà Idazkaria
  3. Francisco Javier López Pellicer Kidea

Mota: Tesia

Teseo: 755814 DIALNET lock_openTDX editor

Laburpena

El llinatge geospacial es pot definir com aquella part de les metadades que descriu l’origen de les dades (essencialment fonts i processos emprats). Aquest té una reconeguda utilitat en la descoberta de dades, anàlisi de la qualitat i en la reproductibilitat de la informació geogràfica, entre d’altres beneficis. Malgrat l’existència de literatura científica i de models de dades ad hoc per representar-lo, la presència d’informació de llinatge a les metadades geospacials és en general encara escassa, i quan hi és present, no és completa. La hipòtesi principal d’aquesta tesi doctoral es basa en que l’absència força generalitzada d’informació de llinatge dins les metadades actua com a factor limitador en la interoperabilitat i la reproductibilitat de dades, processos i models geospacials tan en entorns científics com administratius. Davant d’aquest escenari, són necessàries investigacions que proposin nous mecanismes per potenciar una major incorporació de la informació del llinatge en les metadades geospacials. Aquesta tesi doctoral investiga, en primer lloc, les carències en les fases de representació, captura, emmagatzematge i visualització del llinatge. En segon lloc, proposa alternatives, tan a nivell teòric com aplicat, que potenciïn una millor descripció del llinatge alhora que incrementin la seva presència en les metadades. Finalment, planteja metodologies per augmentar-ne la seva utilitat tan en el context dels Sistemes d’Informació Geogràfica (SIG) com en entorns web distribuïts. Els capítols 2, 3, 4 i 6 fan propostes per millorar les capacitats dels models. En concret, el capítol 2 proposa una adaptació del model W3C PROV (model genèric per descriure el llinatge de tot tipus d’informació a la web) a les singularitats de la informació geogràfica i aprofitar les seves característiques per descriure el llinatge a nivell de conjunt d’informació, d’element geospacial i d’atribut. Els capítols 3 i 4 proposen l’ús combinat dels models de llinatge inclosos a la ISO 19115-1 i la ISO 19115-2 amb l’estàndard Web Processing Service (WPS) de l’Open Geospatial Consortium (OGC) per millorar-ne la completesa. Finalment, el capítol 6 emfatitza en la necessitat de representar i relacionar el llinatge de diversos conjunts de dades per maximitzar-ne els beneficis. Els capítols 3 i 4 presenten una eina anomenada Provenance Engine (PE). L’eina, implementada en el marc del programa de SIG i Teledetecció MiraMon, captura automàticament el llinatge de les execucions realitzades amb el programa. Eines que facilitin la interpretació del llinatge són necessàries i tenen un impacte directe en la seva comprensió i ús. En aquest sentit, el MiraMon permet visualitzar el llinatge com un seqüència de processos. Cada procés té una llista indentada amb tots els paràmetres utilitzats i les sortides generades. A més, el capítol 6 presenta un sistema alternatiu que proporciona i renderitza la informació de llinatge com un graf en un entorn distribuït. En darrer lloc, s’ha treballat en generar propostes que incrementin la utilitat del llinatge i aportin un valor afegit al seu ús. El capítol 5 estableix les bases teòriques per realitzar consultes sobre la informació de llinatge de dades de teledetecció per tal de rebre només aquells fragments de dades o processos que ens poden interessar en un moment determinat. Finalment, el capítol 6 amplia i complementa el capítol 5. En concret, presenta el disseny d’un sistema de consultes inserit en un navegador de mapes. El disseny permet presentar la informació de llinatge de diverses capes incloses en el navegador en una sola vista, veure les interaccions i fer comparacions de fluxos que han donat lloc als diversos conjunts de dades.