跳转到主要内容

3. 在 AgrospAI 上发布资产

关于如何在 AgrospAI 上发布数据和服务的指南。

发布数据集

将一个数据集添加到数据空间意味着注册其元数据,以便它们出现在市场上并可以被获取和使用。只有元数据会被注册到数据空间的基础设施中,数据仍然由数据所有者控制。发布可以通过从数据空间市场选择顶部菜单中的“发布”选项来完成,如图 5 所示。发布表单首先收集数据集所需的元数据,包括标题、描述、标签等。然后,编辑器还必须提供如何使数据集可访问的信息,通过“下载”或“计算”。

在两种情况下,“数据提供者”都将作为中间方来强制执行访问规则。可以使用默认提供者,但编辑者有自由定义自定义提供者。访问信息包括从哪里可以获取数据(通常是下载数据的 URL,该 URL 将由“数据提供者”私密维护)、消费超时时间或指向样本文件的链接,以帮助潜在消费者了解有关数据的更多信息。表单中的下一步骤是设置数据集的价格,可以免费提供,也可以用 EUROe 的价格出售,EUROe 是一种与欧元挂钩的数字货币。该货币被推荐用于使价格更透明。

最后,在确认发布之前,可以通过签署相应的交易来查看资产在市场上如何显示,这些交易将维护一个不可变的发布记录并将数据集绑定到签署交易的帐户。

图 5. 数据集发布表单(来源:https://portal.agrospai.udl.cat

另外,也可以使用 TypeScript 库 Nautilus 或通过命令行工具 Pontus-X CLI 的“publish”命令从代码中发布数据集。

发布算法

AgrospAI 数据空间支持发布数据集和算法。后者是打包为 Docker 容器和脚本的数据处理服务,这些脚本将在容器上下文中执行。发布可以通过与发布数据集相同的方式完成,也就是说,通过顶部菜单中的“发布”选项激活。在相关表单中,需要选择“算法”作为资产类型,而不是“数据集”。

此外,除了标题、描述和标签等元数据外,还需要定义将用于算法的 Docker 镜像。对于访问详细信息,需要提供指向在容器上下文中触发算法执行的脚本的指针。Ocean Protocol 的“Writing Algorithms”中提供了有关如何打包和在数据空间中执行算法的更多详细信息。此外,在 ocean-algo 存储库中还有一些示例。

算法可以作为“下载”或仅供“计算”。在第一个案例中,使用的脚本将在购买后可用于下载。在两种情况下,算法都可以与配置为数据处理消耗的数据集一起消耗。与数据集一样,也可以定义算法的过期时间或价格。最后,在检查了算法元数据之后,可以通过签署相应的交易来确认发布,这些交易将维护一个不可变的发布记录并将算法绑定到签署交易的帐户。

另外,也可以使用 TypeScript 库 Nautilus 或通过命令行工具 Pontus-X CLI 的“publish”命令从代码中发布数据集。

访问和使用策略

AgrospAI 数据空间实现了在 Pontus-X 生态系统中通过智能合约和分布式账本技术实施的访问和使用策略。这些策略可以通过市场用户界面在资源发布期间定义。另外,也可以通过 Nautilus 或 Pontus-X CLI 进行编程配置。

例如,如图 6 所示,可以定义购买资产(数据集或算法)后任何人在需要再次购买之前的等待时间。该时间范围从 1 天到 1 年。此外,使用权限不能过期,并且可以永久持续使用。

图 6. 在发布期间定义资产消耗等待时间(来源:https://portal.agrospai.udl.cat

在资源发布期间定义其他策略的工具是允许和拒绝帐户列表,如图 7 所示。允许列表定义哪些数据空间参与者可以明确消费资产(数据集或算法)。如果该列表为空,则任何人都可以下载或计算此资源。如果一个地址在拒绝列表中,则会为相应的数据集参与者拒绝下载或计算该资源。

图 7. 在发布期间定义允许和拒绝帐户以消耗资产(来源:https://portal.agrospai.udl.cat

最后,也可以编辑配置为“计算”消耗的现有数据集,以定义可在数据集上执行的个别算法,如图 8 所示。此外,数据集所有者还可以使用 Pontus-X CLI 的“edit-trusted-algos”命令自定义允许对数据集运行的算法。

图 8. 定义计算消耗数据集允许的算法(来源:https://portal.agrospai.udl.cat

请注意,我已尽力将原始内容准确地翻译成中文,并且未添加任何额外的信息或修改原有的结构和格式。