了解向部署中使用的空间和数据类型添加和提升数据资产的各种方法。
数据可以是:
- 数据文件(例如 .csv 文件)
- 与存储库 (例如数据库) 中的数据的连接。
- 位于存储区中的已连接数据。 有关更多信息,请参阅 使用 Cloud Object Storage 服务中的数据。
注:
- 有关数据相关术语的定义,请参阅 资产类型和属性。
- 您可以使用 IBM Knowledge Catalog 中的目录作为功能存储,以访问可在组织内共享的数据资产。 数据资产包含有关它们在模型中的使用位置的元数据。 目录控制目录和数据资产级别的访问。
可以通过以下方式之一向空间中添加数据:
添加到空间的数据的管理方式与添加到项目的数据类似。 例如:
- 将数据添加到空间时,就会在该空间中创建资产及其附件的新副本,从而保持对项目资产的回溯引用。 如果资产 (例如数据连接) 需要访问凭证,那么无论您是从项目还是从空间访问数据,这些凭证都将持久存储。
- 就像项目中的数据连接一样,您可以在空间中编辑数据连接详细信息。
- 数据资产以存储在项目中的相同方式存储在空间中。 它们对空间使用与用于项目的结构相同的文件结构。
使用 UI 将数据和连接添加到空间
要使用 UI 将数据或连接添加到空间:
- 从部署空间的 资产 选项卡中,单击 导入资产。
- 在添加已连接的数据资产,目录资产或项目文件之间进行选择:
- 如果要添加已连接的数据资产,请选择 已连接的数据 并选择连接。
- 如果要添加目录资产,请选择 目录资产 并选择目录。
- 如果要添加项目文件,请选择 项目文件 并选择项目文件。
- 单击导入。
数据资产会显示在空间中,并且可在部署作业中用作输入数据源。
以编程方式将数据添加到空间
如果使用 API 来创建、更新或删除watsonx.aiRuntime 资产,请确保使用数据和 AI 通用核心 API。
有关如何以编程方式添加资产的示例,请参阅以下样本 Notebook: 使用 SPSS 和批处理部署以及 Db2 来预测客户流失率
watsonx.aiRuntime 中的数据源引用类型
数据源引用类型在watsonx.aiRuntime 请求中被引用,以表示输入数据和结果位置。 将 data_asset
和 connection_asset
用于以下类型的数据源:
- Cloud Object Storage
- Db2
- 数据库数据
注:
- 对于 Decision Optimization,参考类型为
url
。
Data_asset 有效内容示例
{"input_data_references": [{
"type": "data_asset",
"connection": {
},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
}
}]
Connection_asset 有效内容示例
"input_data_references": [{
"type": "connection_asset",
"connection": {
"id": "<connection_guid>"
},
"location": {
"bucket": "<bucket_name>",
"file_name": "<directory_name>/<file_name>"
}
<other wdp-properties supported by runtimes>
}]
有关更多信息,请参阅:
- watsonx.ai运行时REST API
使用来自 Cloud Object Storage 服务的数据
Cloud Object Storage 服务可通过连接的数据资产或连接资产,与部署作业配合使用。 要使用来自 Cloud Object Storage 服务的数据:
创建与IBM Cloud Object Storage的连接在项目或空间中添加连接,并选择Cloud Object Storage (infrastructure)或Cloud Object Storage作为连接器。 提供密钥,访问密钥和登录 URL。
注:创建与 Cloud Object Storage 或 Cloud Object Storage (基础结构) 的连接时,必须同时指定
access_key
和secret_key
。 如果未指定access_key
和secret_key
,那么从该连接下载数据在批处理部署作业中不起作用。 有关参考,请参阅IBM Cloud Object Storage连接和IBM Cloud Object Storage (infrastructure)连接。使用您创建的 Cloud Object Storage 连接将输入和输出文件作为已连接数据添加到部署空间。
父主题: 部署空间中的资产