要访问您的数据IBM watsonx.data,为其创建连接资产。 连接资产包括连接到 watsonx.data 实例和在该实例上运行的 Presto 查询引擎的信息。
IBM watsonx.data 是一个开放的混合受管数据湖,由查询引擎针对所有数据和 AI 工作负载进行优化。
准备工作
watsonx.data Presto 和 Presto 连接之间的区别
IBM watsonx.data 整合了 Presto SQL Query引擎。 watsonx.data Presto 和 Presto 连接都可以创建连接资产,以便与 Presto SQL Query 引擎中的 IBM watsonx.data 进行交互。
watsonx.data Presto 连接
watsonx.data Presto连接支持使用Presto SQL Query引擎从IBM watsonx.data读取数据,并支持将 Iceberg 表格式的表格写入IBM watsonx.data 中的Amazon S3、ApacheOzone、IBMCeph 和IBM Cloud Object Storage桶。 如果您希望与IBM Knowledge Catalog集成以利用watsonx.data 服务,也需要该连接。
IBM 建议使用 watsonx.data Presto 连接从 Cloud Pak for Data 连接到 IBM watsonx.data.
时
有关 watsonx.data Presto 连接的更多信息,请参阅本主题的其余部分。
Presto
Presto 连接可以为任何 Presto 引擎(包括 IBM watsonx.data 中的实现)创建只读连接。
有关 Presto 连接的更多信息,请参阅 Presto 连接。
先决条件
设置 watsonx.data的实例。
您可以连接到软件或作为服务实例:
watsonx.data Cloud Pak for Data 软件:请参见在Cloud Pak for Data上安装watsonx.data。
watsonx.data作为IBM Cloud的一项服务:请参见在IBM Cloud开始使用watsonx.data
watsonx.data单机版软件:请参阅安装单机版watsonx.data
创建与 watsonx.data 的连接
您选择的部署类型不同,连接细节也不同。 要创建连接资产,请在 Connect to a data source 页面的 Connection details 部分选择部署类型:
- IBM watsonx.data开发人员版本
- IBM watsonx.data 上的 IBM Cloud
- IBM watsonx.data on Red Hat OpenShift
您也可以将部署类型保留为默认值,这样就可以看到传统连接的详细信息。
您需要提供的详细信息将根据您选择的缴费类型而有所不同:
IBM watsonx.data 开发人员版
您可以使用导入连接值导入 JSON 文件来填写这些字段。 要获取该连接所需的 JSON 文件,需要进入watsonx.data实例的控制台页面,导航到连接信息字段,然后复制 JSON 文件。
- 主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。
- 端口: 缺省端口号为
443
。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。 - 实例 ID:在 watsonx.data 控制台中查找该值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。
IBM watsonx.data on IBM Cloud
您可以使用导入连接值导入 JSON 文件来填写这些字段。 要获取该连接所需的 JSON 文件,需要进入watsonx.data实例的控制台页面,导航到连接信息字段,然后复制 JSON 文件。
- 主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。
- 端口: 缺省端口号为
443
。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。 - CRN:云资源名称:在 watsonx.data 控制台中查找此值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。
IBM watsonx.data on Red Hat OpenShift
您可以使用导入连接值导入 JSON 文件来填写这些字段。 要获取该连接所需的 JSON 文件,需要进入watsonx.data实例的控制台页面,导航到连接信息字段,然后复制 JSON 文件。
- 主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。
- 端口: 缺省端口号为
443
。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。 - 实例 ID:在 watsonx.data 控制台中查找该值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。
传统连接详情
watsonx.data软件
要创建连接资产,请在 Connect to a data source 页面的 Connection details 部分中,选择 Connect to watsonx.data on Cloud Pak for Data 并提供这些详细信息:
- 主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。
- 端口: 缺省端口号为
443
。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。 - 实例 ID:在 watsonx.data 控制台中查找该值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。
- 实例名称:在 Cloud Pak for Data Web 客户端主页中查找实例名称。 从导航菜单中单击 服务 > 实例。
watsonx.data 作为服务
主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。
端口: 缺省端口号为
443
。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。实例 ID:在 watsonx.data 控制台中查找该值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。
实例名称:在watsonx.ai服务实例页。 点击管理 > 服务 > 服务实例。 例如,
watsonx.data-aaa
。 请勿使用字段中显示的建议实例名称。CRN:云资源名称:在 watsonx.data 控制台中查找此值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。
凭证
您的证书因所选的部署类型而异:
- IBM watsonx.data开发人员版本
- IBM watsonx.data 上的 IBM Cloud
- IBM watsonx.data on Red Hat OpenShift
您也可以将部署类型保留为默认值,这样就可以看到传统连接的详细信息。
IBM watsonx.data 开发人员版
- 用户名和密码:用于登录 watsonx.datastandalone 控制台的用户名和密码。
IBM watsonx.data on IBM Cloud
- API 密钥:可访问 IBM Cloud.
上 watsonx.data 实例的账户的 API 密钥
API 密钥可在 IBM Cloud 控制台中生成。
IBM watsonx.data on Red Hat OpenShift
您必须选择一种身份验证方法:
- 用户名和密码:用于访问 Cloud Pak for Data 的用户名和密码,watsonx.data 实例位于该处。
- 用户名和 API 密钥: The username and API key that is used to access Cloud Pak for Data where the watsonx.data instance is located.
如果 Cloud Pak for Data 使用身份管理服务 (IAM),例如 LDAP 或 SSO,则建议使用此身份验证方法。 API 密钥位于目标 Cloud Pak for Data 群集的 配置文件和设置中。 有关 API 密钥的信息,请参阅 生成用于身份验证的 API 密钥。
传统连接详情
watsonx.data软件
watsonx.data 实例的用户名和密码或用户名和 API 密钥。 发动机也使用了同样的证书。
您必须选择身份验证方法:
- 用户名和密码:用于访问 Cloud Pak for Data 实例所在 watsonx.data 的用户名和密码,或用于 watsonx.data 独立运行的用户名和密码。
- 用户名和 API 密钥:用于访问 Cloud Pak for Data 实例所在 watsonx.data 的用户名和 API 密钥,或用于 watsonx.data 单机版的用户名和密码。 如果 Cloud Pak for Data 使用身份管理服务 (IAM),例如 LDAP 或 SSO,则建议使用此身份验证方法。 API 密钥位于目标 Cloud Pak for Data 群集的 配置文件和设置中。 有关 API 密钥的信息,请参阅 生成用于身份验证的 API 密钥。
watsonx.data 作为服务
watsonx.data 实例的用户名和密码。 发动机也使用了同样的证书。
- Username: 默认用户名是
ibmlhapikey_<cloud-account-email-address>
。 例如,[email protected]
。 - 密码:密码是用户的 API 密钥。 要创建 API 密钥,请参阅 IBM Cloud 文档:在控制台中创建 API 密钥。
证书
缺省情况下,选择了 已启用 SSL 。 建议使用此设置以提高安全性。 如果不使用 SSL ,那么数据可能存在诸如数据泄漏之类的漏洞。 虽然 watsonx.data 中托管的数据库也可以具有 SSL 证书,但连接将通过引擎。
SSL 证书必须采用 PEM 格式。
SSL 证书信息因所选部署类型而异:
- IBM watsonx.data开发人员版本
- IBM watsonx.data 上的 IBM Cloud
- IBM watsonx.data on Red Hat OpenShift
IBM watsonx.data 开发人员版
SSL 证书是可选的。
如果在 Cloud Pak for Data 上的 watsonx.data 实例上启用了 SSL ,并且该证书是自签名证书,那么必须在 SSL 证书 字段中输入该证书。
询问 watsonx.data 管理员是否设置了 SSL。 你可以在 watsonx.data 控制台的 配置 > 连接信息 > 实例详细信息 下找到 SSL 证书。
IBM watsonx.data on IBM Cloud
SSL 证书是可选的。
IBM watsonx.data on Red Hat OpenShift
SSL 证书是可选的。
如果在 Cloud Pak for Data 上的 watsonx.data 实例上启用了 SSL ,并且该证书是自签名证书,那么必须在 SSL 证书 字段中输入该证书。
询问 watsonx.data 管理员是否设置了 SSL。 你可以在 watsonx.data 控制台的 配置 > 连接信息 > 实例详细信息 下找到 SSL 证书。
引擎连接详细信息
输入发动机连接详情
支持的引擎版本
对于 watsonx.data 上的 Cloud Pak for Data 版本 5.0.3 及更高版本:
- Presto(Java)
- Presto (C++)
对于 watsonx.data 上的 Cloud Pak for Data 版本 5.0.2 及之前的版本:
- Presto(Java)
将 watsonx.data 作为服务:
- Presto(Java)
- Presto (C++)
提供这些引擎连接详细信息。 在 watsonx.data 网络控制台的 Configurations > Connection information > Engine and service connection details 下查找此信息。
引擎的主机名或 IP 地址:主机名或 IP 地址是内部主机场地。
引擎 ID :该值位于引擎 ID场地。
发动机端口:端口号是内部主机冒号后的字段(
:
)。默认端口号为8443
。
根据您在平台中的位置选择创建连接的方法
- 在项目中
- 单击 资产> 新资产> 连接到数据源。 请参阅将连接添加到项目。
- 在目录中
- 单击 添加到目录> 连接。 请参阅将连接资产添加到目录中。
- 在平台资产目录中
- 单击新建连接。 请参阅添加平台连接。
下一步:从连接添加数据资产
请参阅通过项目中的连接添加数据。
请参阅从目录中的连接添加数据。
您可以在何处使用此连接
您可以在以下工作区和工具中使用 watsonx.data Presto 连接:
项目
- Data Refinerywatsonx.aiStudio 或IBM Knowledge Catalog
- DataStage (DataStage 服务)。 请参阅 连接到 DataStage中的数据源。
- Decision Optimization(watsonx.ai工作室和 "watsonx.ai运行时)
- Metadata import (IBM Knowledge Catalog)
目录
Platform assets catalog
其他目录 (IBM Knowledge Catalog)
将数据写入watsonx.data
您可以将数据导入watsonx.data和DataStage。 您必须输入catalog_name
,schema_name
, 和table_name
特性。 table_name
属性为必填项。 您可以将全限定名称 catalog_name.schema_name.table_name
传递到 table_name
属性中。
watsonx.data Presto连接器直接在IBM watsonx.data 中定义的存储上创建 Iceberg 表。 目前,该连接器支持写入以下存储:
- Amazon S3
- Apache臭氧
- IBMCeph
- IBM Cloud Object Storage
watsonx.data Web 控制台
了解更多信息
相关连接
父主题: 支持的连接