Saltar al contingut principal

Sobre

Demostrador d'espai de dades agroalimentàries per a serveis de compartició de dades sobiranes i Intel·ligència Artificial.

Aquest demostrador es planteja amb una important càrrega de personal per a l'assessorament i desenvolupament de casos d'ús per donar suport als participants que han mostrat el seu interès però no han tingut l'oportunitat o la capacitat de presentar els seus casos d'ús per separat per a aquesta convocatòria.

A més, implica una àmplia i diversa xarxa de participants interessats a formar part del demostrador, representant àmpliament els diferents tipus d'actors involucrats en el sector agroalimentari, especialment la part productiva ja que es vol mantenir una estreta col·laboració amb el futur Espai Comú Europeu de Dades Agrícoles (CEADS), que se centra en aquest sector.

L'espai de dades es regirà per un codi de governança explícit, assegurant una major transparència, amb especial atenció a preservar l'equitat dels participants i la seva no discriminació, així com la seva sostenibilitat.

Els participants exerciran diferents rols, inclosos productors i consumidors de dades, consumidors de dades i proveïdors de serveis, proveïdors de serveis informàtics i operadors de serveis ecosistèmics de l'espai de dades. Els proveïdors de computació també actuaran com a intermediaris de dades, en particular el paper de tercer de confiança on es processa la informació.

La intermediació per al processament de dades es realitzarà utilitzant tecnologia de computació a dades, de manera que es pugui garantir la sobirania de les dades per disseny. Aquest servei es contractarà amb un proveïdor de "sales de dades" al núvol, que proporcionarà l'entorn d'alt rendiment per realitzar la computació de dades, inclosos els processos d'Intel·ligència Artificial.

El codi de governança de l'espai de dades permetrà la promulgació de polítiques d'accés i ús de recursos. També definirà mecanismes per crear incentius per compartir dades i serveis, així com per a la sostenibilitat del mateix espai de dades. Aquests mecanismes es basaran en un Euro electrònic que utilitzi tecnologies de registre distribuït, sense valor econòmic real durant la fase de demostració, però que permetrà a tots els participants explorar possibles economies de dades per a la sostenibilitat futura de l'espai de dades.

La infraestructura de registre distribuït utilitzada per a la monetització de l'espai de dades també permetrà el seguiment de les transaccions de l'espai de dades i la seva auditoria. A partir d'aquest registre es desplegaran també mecanismes de resolució de conflictes estipulats en el propi codi de governança.

El demostrador es basarà en els principis FAIR per facilitar la cerca i l'accés als recursos compartits a través del mateix, i fer-los interoperables i reutilitzables. Per a això, tots els recursos comptaran amb descripcions de les seves característiques i condicions d'ús, utilitzant tecnologies semàntiques que facilitin el seu processament automàtic.

L'espai de dades albergarà tant recursos propietaris (dades i serveis per al seu processament) compartits sota condicions d'ús, com fonts de dades obertes, especialment conjunts de dades d'alt valor i de gran rellevància en el sector agroalimentari 1. Especialment fonts de dades obertes rellevants per al sector agroalimentari com els generats pels programes Galileo i Copernicus.

Els serveis compartits a través de l'espai de dades inclouran algoritmes que implementin mecanismes per validar el nivell de qualitat de les dades aportades pels participants. Aquests algoritmes, per exemple, l'Anàlisi Exploratòria de Dades (EDA), poden aplicar-se a les dades per calcular mètriques de qualitat assegurant la seva sobirania. Això serà a causa del propi disseny de l'espai de dades, que implementa mecanismes de computació a dades que poden assegurar que el propietari no perdi el control sobre els mateixos.

Per facilitar la interoperabilitat i reutilització de dades i serveis, l'espai de dades integrarà serveis de transformació de dades en representacions basades en tecnologies semàntiques que faran referència a formalitzacions com ontologies de vocabularis comuns del domini agroalimentari.

El demostrador proposat es desplegarà utilitzant els components de l'ecosistema d'espai de dades Pontus-X1. Aquests components són de codi obert i qualsevol nou desenvolupament o millora que es realitzi durant el projecte es compartirà de la mateixa manera que en els repositoris de codi obert de Pontus-X.

Es contractaran els serveis d'una empresa que proporcioni els components de Pontus-X per facilitar la integració del demostrador amb altres espais de dades que ja estan en marxa en aquest ecosistema. A més, aquesta empresa proporcionarà els components de forma dedicada per a la versió de prova de l'espai de dades, que funcionarà de forma independent. Aquests components, tant en la seva versió compartida com dedicada, proporcionen les següents tecnologies:

  1. Tecnologies "Compute-to-data" per garantir la privadesa i sobirania de les dades per disseny, de manera que es pugui garantir que les dades es processin de manera protegida i confidencial. També permeten implementar l'aprenentatge federat.

  2. Mecanismes per compartir dades, però també serveis de processament de dades, preferiblement encapsulats com a contenidors (Docker i Kubernetes) amb tot el seu codi i dependències per facilitar la seva portabilitat i execució en l'entorn “compute-to-data”. Aquests serveis inclouen eines avançades d'analítica descriptiva, predictiva i prescriptiva.

  3. Tecnologies de llibre major distribuït que permeten traçar totes les transaccions realitzades en l'ecosistema d'espais de dades, per tant múltiples espais de dades connectats.

  4. Tecnologies de Smart Contract que permeten implementar els mecanismes de monetització de dades, serveis i costos computacionals del mecanisme “compute-to-data”. Llibre major distribuït i contractes intel·ligents basats en l'estàndard EVM (Ethereum Virtual Machine). Faciliten la independència de la solució tecnològica subjacent, possibilitant la seva portabilitat i desplegament a través de diferents infraestructures.

  5. Tecnologies de Moneder Digital per assegurar la sobirania dels participants i l'autogestió d'atributs relacionats amb la seva identitat.

Notes al peu

  1. Chamorro-Padial, J., García, R., & Gil, R. (2024). Una revisió sistemàtica de dades obertes en agricultura. Computadores y electrónica en la agricultura, 219, 108775. DOI: 10.1016/j.compag.2024.108775