Acerca de
Demostrador de espacio de datos agroalimentarios para servicios de compartición de datos soberanos e Inteligencia Artificial.
Este demostrador se plantea con una importante carga de personal para el asesoramiento y desarrollo de casos de uso para apoyar a los participantes que han mostrado su interés pero no han tenido la oportunidad o la capacidad de presentar sus casos de uso por separado para esta convocatoria.
Además, implica una amplia y diversa red de participantes interesados en formar parte del demostrador, representando ampliamente a los diferentes tipos de actores involucrados en el sector agroalimentario, especialmente la parte productiva ya que se quiere mantener una estrecha colaboración con el futuro Espacio Común Europeo de Datos Agrícolas (CEADS), que se centra en este sector.
El espacio de datos se regirá por un código de gobernanza explícito, asegurando una mayor transparencia, con especial atención a preservar la equidad de los participantes y su no discriminación, así como su sostenibilidad.
Los participantes desempeñarán diferentes roles, incluidos productores y consumidores de datos, consumidores de datos y proveedores de servicios, proveedores de servicios informáticos y operadores de servicios ecosistémicos del espacio de datos. Los proveedores de computación también actuarán como intermediarios de datos, en particular el papel de tercero de confianza donde se procesa la información.
La intermediación para el procesamiento de datos se realizará utilizando tecnología de computación a datos, de modo que se pueda garantizar la soberanía de los datos por diseño. Este servicio se contratará con un proveedor de "salas de datos" en la nube, que proporcionará el entorno de alto rendimiento para realizar la computación de datos, incluidos los procesos de Inteligencia Artificial.
El código de gobernanza del espacio de datos permitirá la promulgación de políticas de acceso y uso de recursos. También definirá mecanismos para crear incentivos para compartir datos y servicios, así como para la sostenibilidad del propio espacio de datos. Estos mecanismos se basarán en un Euro electrónico que utilice tecnologías de registro distribuido, sin valor económico real durante la fase de demostración, pero que permitirá a todos los participantes explorar posibles economías de datos para la sostenibilidad futura del espacio de datos.
La infraestructura de registro distribuido utilizada para la monetización del espacio de datos también permitirá el seguimiento de las transacciones del espacio de datos y su auditoría. A partir de este registro se desplegarán también mecanismos de resolución de conflictos estipulados en el propio código de gobernanza.
El demostrador se basará en los principios FAIR para facilitar la búsqueda y acceso a los recursos compartidos a través del mismo, y hacerlos interoperables y reutilizables. Para ello, todos los recursos contarán con descripciones de sus características y condiciones de uso, utilizando tecnologías semánticas que faciliten su procesamiento automático.
El espacio de datos albergará tanto recursos propietarios (datos y servicios para su procesamiento) compartidos bajo condiciones de uso, como fuentes de datos abiertos, especialmente conjuntos de datos de alto valor y de gran relevancia en el sector agroalimentario 1. Especialmente fuentes de datos abiertos relevantes para el sector agroalimentario como los generados por los programas Galileo y Copernicus.
Los servicios compartidos a través del espacio de datos incluirán algoritmos que implementen mecanismos para validar el nivel de calidad de los datos aportados por los participantes. Estos algoritmos, por ejemplo, el Análisis Exploratorio de Datos (EDA), pueden aplicarse a los datos para calcular métricas de calidad asegurando su soberanía. Esto será debido al propio diseño del espacio de datos, que implementa mecanismos de computación a datos que pueden asegurar que el propietario no pierda el control sobre los mismos.
Para facilitar la interoperabilidad y reutilización de datos y servicios, el espacio de datos integrará servicios de transformación de datos en representaciones basadas en tecnologías semánticas que harán referencia a formalizaciones como ontologías de vocabularios comunes del dominio agroalimentario.
El demostrador propuesto se desplegará utilizando los componentes del ecosistema de espacio de datos Pontus-X1. Estos componentes son de código abierto y cualquier nuevo desarrollo o mejora que se realice durante el proyecto se compartirá de la misma manera que en los repositorios de código abierto de Pontus-X.
Se contratarán los servicios de una empresa que proporcione los componentes de Pontus-X para facilitar la integración del demostrador con otros espacios de datos que ya están en marcha en este ecosistema. Además, esta empresa proporcionará los componentes de forma dedicada para la versión de prueba del espacio de datos, que funcionará de forma independiente. Estos componentes, tanto en su versión compartida como dedicada, proporcionan las siguientes tecnologías:
-
Tecnologías "Compute-to-data" para garantizar la privacidad y soberanía de los datos por diseño, de modo que se pueda garantizar que los datos se procesen de manera protegida y confidencial. También permiten implementar el aprendizaje federado.
-
Mecanismos para compartir datos, pero también servicios de procesamiento de datos, preferiblemente encapsulados como contenedores (Docker y Kubernetes) con todo su código y dependencias para facilitar su portabilidad y ejecución en el entorno “compute-to-data”. Estos servicios incluyen herramientas avanzadas de analítica descriptiva, predictiva y prescriptiva.
-
Tecnologías de libro mayor distribuido que permiten trazar todas las transacciones realizadas en el ecosistema de espacios de datos, por ende múltiples espacios de datos conectados.
-
Tecnologías de Smart Contract que permiten implementar los mecanismos de monetización de datos, servicios y costos computacionales del mecanismo “compute-to-data”. Libro mayor distribuido y contratos inteligentes basados en el estándar EVM (Ethereum Virtual Machine). Facilitan la independencia de la solución tecnológica subyacente, posibilitando su portabilidad y despliegue a través de diferentes infraestructuras.
-
Tecnologías de Monedero Digital para asegurar la soberanía de los participantes y la autogestión de atributos relacionados con su identidad.
Notas al pie
-
Chamorro-Padial, J., García, R., & Gil, R. (2024). Una revisión sistemática de datos abiertos en agricultura. Computadoras y electrónica en la agricultura, 219, 108775. DOI: 10.1016/j.compag.2024.108775 ↩