Saltar al contingut principal

Centre d'Estudis Porcins de Catalunya (CEP)

Aquesta història d'èxit en el sector porcí explora les oportunitats d'intercanvi de dades que ofereixen els espais de dades, especialment pel que fa a com es podrien reduir les barreres d'intercanvi de dades garantint que els originadors de dades mantinguin el control de les seves dades. Per tant, la implementació de l'espai de dades es basa en l'ecosistema Gaia-X Pontus-X, utilitzant una infraestructura basada en Web3 i blockchain que proporciona Sobirania de Dades per Disseny. A més, com que Pontus-X es basa en Gaia-X, els seus blocs de construcció s'utilitzen per facilitar la federació de l'espai de dades, especialment la Gaia-X Digital Clearing House (GXDCH)1. Concretament:

El cas d'ús està a càrrec de la Universitat de Lleida (UdL) en cooperació amb el Centre of Swine Studies of Catalonia (CEP), una granja porcina experimental gestionada per un consorci format per la Diputació de Lleida, el Consell Regional de La Noguera, l'Ajuntament de Torrelameu i la Universitat de Lleida. El paper del CEP és principalment com a originador de dades, disposat a compartir a través de l'espai de dades les dades generades com a resultat dels diferents experiments realitzats a la granja porcina. Per al CEP, és crucial que puguin mantenir el control de les dades que aporten, especialment quan és generat per tercers com a fabricants de màquines d'alimentació automàtica provant els seus productes al CEP.

A més, els mecanismes de monetització proporcionats pel Pontus-X s'estan provant per avaluar diferents mecanismes d'incentius que fan que el cas d'ús sigui sostenible més enllà de la fase actual de prova de concepte.

Actualment, s'ofereixen dos serveis, basats en dades proporcionades per CEP. Primer, basat en imatges de videovigilància d'un dels corrals del CEP, un algoritme d'avaluació del benestar animal realitza la segmentació i el seguiment automàtic d'imatges per identificar i rastrejar els moviments dels porcs. A més, també és possible monitoritzar les visites dels porcs a àrees d'interès definides com la màquina d'alimentació automàtica o el bol del bevedor. Això permet la generació automàtica de mètriques que poden usar-se per a l'avaluació del benestar animal.

La sobirania de les dades està garantida per disseny a través d'una Sala de Dades implementada usant "Compute-to-Data", com es mostra a la Fig. 16. L'algoritme visita la seqüència d'imatges dins de la sala de dades, on s'analitzen, i només les mètriques calculades surten de la sala. En conseqüència, no hi ha fuga de cap imatge des de dins de la granja. Simplement es copien a la sala de dades i es destrueixen després del càlcul sense sortir-ne. Un conjunt de dades de mostra, que té el consentiment del CEP per ser "visitat" per l'algoritme d'avaluació del benestar, està disponible en línia6.

Fig. 1. Intercanvi de dades sobiranes de les dades del CEP a través d'una Sala de Dades basada en "Compute-to-Data" (font: AgrospAI)

El segon servei dóna suport a l'enfocament "Pagament per ús" en compartir dades a través d'un espai de dades. En lloc de requerir que els editors integrin les dades basades en esquemes existents, cosa que causa una sobrecàrrega inicial significativa, el paradigma de pagament per ús afavoreix un enfocament incremental. D'aquesta manera, es redueixen les barreres d'entrada i es facilita l'intercanvi de dades.

Les dades es publiquen en forma tabular, per exemple, els generats pel CEP màquines d'alimentació automàtica. La integració semàntica és proporcionada per un algoritme que implementa RML, una extensió de l'estàndard R2RML W3C, que a més de mapejar des de bases de dades relacionals a dades semàntiques RDF, també proporciona mapatges des de fonts de dades CSV, TSV, XML i JSON a RDF.

A més, la sobirania de les dades està garantida per disseny a través de la Sala de Dades. Les dades mapejades no surten de la sala, es processen i després s'emmagatzemen en un Gràfic de Coneixement que roman dins de la sala. D'aquesta manera, roman sota el control de l'originador de dades, el Centre of Swine Studies of Catalonia (CEP).

Més tard, el CEP pot decidir atorgar accés a algoritmes de confiança per visitar el Sala de Dades i tallar el Gràfic de Coneixement per extreure el semànticament dades integrades rellevants per als seus càlculs. També en aquest cas, les dades la sobirania està garantida ja que només els resultats de la computació, com les agregacions o els models entrenats amb IA, poden sortir de la sala, no les dades originals o subconjunts dels mateixos.

Actualment, el CEP pot compartir directament les seves dades tabulars existents sobre Pes diari de porcs i dades de màquines d'alimentació automàtica. Aquestes dades romanen sota el seu control, ja que el CEP pot decidir quins algoritmes poden visitar-lo a la Sala de Dades. Per exemple, un algoritme d'anàlisi de dades exploratòries per construir resums de les dades7.

A més, l'algoritme RML Mapper8 proporciona mapatges per al CEP Formats de dades de pes diari i màquina d'alimentació automàtica que fan que sigui possible seguir l'enfocament incremental i per nivells proposat pel paradigma de pagament per ús. Mapeja aquest tipus de dades CSV a W3C RDF dades semàntiques basades en vocabularis i ontologies ben establertes que faciliten la integració de dades, fins i tot entre casos d'ús i sectors d'activitat.

El mapeig implementat per aquest algoritme genera dades RDF basades en l'ontologia de referència d'aplicacions intel·ligents (SAREF), un vocabulari compatible amb l'European Telecommunications Standards Institute (ETSI) que facilita la integració de dades en el domini de les aplicacions intel·ligents.

Per exemple, per a les dades de pes diari de porcs:

ID d'animalDataPes (g)
9820910628941962021-03-1616300

I les dades de la màquina d'alimentació automàtica:

CorralID d'animalDataHora (s)DuradaAlimentació (g)Pes (g)
49820910628941962021-03-1710:46501416500

El mapeig RML genera el gràfic de dades semàntiques RDF que integra ambdues fonts de dades, com es mostra a la Fig. 2.

Fig. 2. Integració semàntica del pes diari del porc del CEP i la màquina d'alimentació automàtica Dades (font: AgrospAI)

Notes al peu

  1. https://compliance.lab.gaia-x.eu

  2. https://compliance.lab.gaia-x.eu/development/docs

  3. https://registry.lab.gaia-x.eu/development/docs

  4. https://registrationnumber.notary.lab.gaia-x.eu/development/docs

  5. https://ces-development.lab.gaia-x.eu/q/swagger-ui/

  6. https://dataspace.angliru.udl.cat/asset/did:op:31d6d1ea0fc540e1ea6e5268ebfd53e8129992cd6971dfbbbd0b88b08ca6f939

  7. https://dataspace.angliru.udl.cat/asset/did:op:34d5f73d77550843201ee1a43ad9d404d3e557ed6a70772e9afde7a27d863b8f

  8. https://dataspace.angliru.udl.cat/asset/did:op:d20f956e79709fb2469fffe2bd85cf2fec95a21d2497998bb530043c6bbec901