0 / 0
Go back to the English version of the documentation
IBM watsonx.data Presto 连接
Last updated: 2024年12月11日
IBM watsonx.data Presto 连接

要访问您的数据IBM watsonx.data,为其创建连接资产。 连接资产包括连接到 watsonx.data 实例和在该实例上运行的 Presto 查询引擎的信息。

IBM watsonx.data 是一个开放的混合受管数据湖,由查询引擎针对所有数据和 AI 工作负载进行优化。

准备工作

watsonx.data Presto 和 Presto 连接之间的区别

IBM watsonx.data 整合了 Presto SQL Query引擎。 watsonx.data Presto 和 Presto 连接都可以创建连接资产,以便与 Presto SQL Query 引擎中的 IBM watsonx.data 进行交互。

watsonx.data Presto 连接

watsonx.data Presto连接支持使用Presto SQL Query引擎从IBM watsonx.data读取数据,并支持将 Iceberg 表格式的表格写入IBM watsonx.data 中的Amazon S3、ApacheOzone、IBMCeph 和IBM Cloud Object Storage桶。 如果您希望与IBM Knowledge Catalog集成以利用watsonx.data 服务,也需要该连接。

IBM 建议使用 watsonx.data Presto 连接从 Cloud Pak for Data 连接到 IBM watsonx.data.

有关 watsonx.data Presto 连接的更多信息,请参阅本主题的其余部分。

Presto

Presto 连接可以为任何 Presto 引擎(包括 IBM watsonx.data 中的实现)创建只读连接。

有关 Presto 连接的更多信息,请参阅 Presto 连接

先决条件

设置 watsonx.data的实例。

您可以连接到软件或作为服务实例:

创建与 watsonx.data 的连接

您选择的部署类型不同,连接细节也不同。 要创建连接资产,请在 Connect to a data source 页面的 Connection details 部分选择部署类型:

  • IBM watsonx.data开发人员版本
  • IBM watsonx.data 上的 IBM Cloud
  • IBM watsonx.data on Red Hat OpenShift

您也可以将部署类型保留为默认值,这样就可以看到传统连接的详细信息。

您需要提供的详细信息将根据您选择的缴费类型而有所不同:

IBM watsonx.data 开发人员版

您可以使用导入连接值导入 JSON 文件来填写这些字段。 要获取该连接所需的 JSON 文件,需要进入watsonx.data实例的控制台页面,导航到连接信息字段,然后复制 JSON 文件。

  • 主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。
  • 端口: 缺省端口号为 443。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。
  • 实例 ID:在 watsonx.data 控制台中查找该值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。

IBM watsonx.data on IBM Cloud

您可以使用导入连接值导入 JSON 文件来填写这些字段。 要获取该连接所需的 JSON 文件,需要进入watsonx.data实例的控制台页面,导航到连接信息字段,然后复制 JSON 文件。

  • 主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。
  • 端口: 缺省端口号为 443。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。
  • CRN:云资源名称:在 watsonx.data 控制台中查找此值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。

IBM watsonx.data on Red Hat OpenShift

您可以使用导入连接值导入 JSON 文件来填写这些字段。 要获取该连接所需的 JSON 文件,需要进入watsonx.data实例的控制台页面,导航到连接信息字段,然后复制 JSON 文件。

  • 主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。
  • 端口: 缺省端口号为 443。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。
  • 实例 ID:在 watsonx.data 控制台中查找该值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。

传统连接详情

watsonx.data软件

要创建连接资产,请在 Connect to a data source 页面的 Connection details 部分中,选择 Connect to watsonx.data on Cloud Pak for Data 并提供这些详细信息:

  • 主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。
  • 端口: 缺省端口号为 443。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。
  • 实例 ID:在 watsonx.data 控制台中查找该值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。
  • 实例名称:在 Cloud Pak for Data Web 客户端主页中查找实例名称。 从导航菜单中单击 服务 > 实例
watsonx.data 作为服务
  • 主机名或 IP 地址:在控制台 配置 > 连接信息 > 实例详细信息 下查找此信息。

  • 端口: 缺省端口号为 443。 您可以在控制台的 配置 > 连接信息 > 实例详细信息 下找到这些信息。

  • 实例 ID:在 watsonx.data 控制台中查找该值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。

  • 实例名称:在watsonx.ai服务实例页。 点击管理 > 服务 > 服务实例。 例如,watsonx.data-aaa。 请勿使用字段中显示的建议实例名称。

  • CRN:云资源名称:在 watsonx.data 控制台中查找此值。 点击实例详细信息从导航菜单中。 您还可以在控制台 配置 > 连接信息 > 实例详细信息 下找到此信息。

凭证

您的证书因所选的部署类型而异:

  • IBM watsonx.data开发人员版本
  • IBM watsonx.data 上的 IBM Cloud
  • IBM watsonx.data on Red Hat OpenShift

您也可以将部署类型保留为默认值,这样就可以看到传统连接的详细信息。

IBM watsonx.data 开发人员版

  • 用户名和密码:用于登录 watsonx.datastandalone 控制台的用户名和密码。

IBM watsonx.data on IBM Cloud

  • API 密钥:可访问 IBM Cloud.
    上 watsonx.data 实例的账户的 API 密钥

API 密钥可在 IBM Cloud 控制台中生成。

IBM watsonx.data on Red Hat OpenShift

您必须选择一种身份验证方法:

  • 用户名和密码:用于访问 Cloud Pak for Data 的用户名和密码,watsonx.data 实例位于该处。
  • 用户名和 API 密钥: The username and API key that is used to access Cloud Pak for Data where the watsonx.data instance is located.

如果 Cloud Pak for Data 使用身份管理服务 (IAM),例如 LDAP 或 SSO,则建议使用此身份验证方法。 API 密钥位于目标 Cloud Pak for Data 群集的 配置文件和设置中。 有关 API 密钥的信息,请参阅 生成用于身份验证的 API 密钥

传统连接详情

watsonx.data软件

watsonx.data 实例的用户名和密码或用户名和 API 密钥。 发动机也使用了同样的证书。

您必须选择身份验证方法:

  • 用户名和密码:用于访问 Cloud Pak for Data 实例所在 watsonx.data 的用户名和密码,或用于 watsonx.data 独立运行的用户名和密码。
  • 用户名和 API 密钥:用于访问 Cloud Pak for Data 实例所在 watsonx.data 的用户名和 API 密钥,或用于 watsonx.data 单机版的用户名和密码。 如果 Cloud Pak for Data 使用身份管理服务 (IAM),例如 LDAP 或 SSO,则建议使用此身份验证方法。 API 密钥位于目标 Cloud Pak for Data 群集的 配置文件和设置中。 有关 API 密钥的信息,请参阅 生成用于身份验证的 API 密钥
watsonx.data 作为服务

watsonx.data 实例的用户名和密码。 发动机也使用了同样的证书。

证书

缺省情况下,选择了 已启用 SSL 。 建议使用此设置以提高安全性。 如果不使用 SSL ,那么数据可能存在诸如数据泄漏之类的漏洞。 虽然 watsonx.data 中托管的数据库也可以具有 SSL 证书,但连接将通过引擎。

SSL 证书必须采用 PEM 格式。

SSL 证书信息因所选部署类型而异:

  • IBM watsonx.data开发人员版本
  • IBM watsonx.data 上的 IBM Cloud
  • IBM watsonx.data on Red Hat OpenShift

IBM watsonx.data 开发人员版

SSL 证书是可选的。

如果在 Cloud Pak for Data 上的 watsonx.data 实例上启用了 SSL ,并且该证书是自签名证书,那么必须在 SSL 证书 字段中输入该证书。

询问 watsonx.data 管理员是否设置了 SSL。 你可以在 watsonx.data 控制台的 配置 > 连接信息 > 实例详细信息 下找到 SSL 证书。

IBM watsonx.data on IBM Cloud

SSL 证书是可选的。

IBM watsonx.data on Red Hat OpenShift

SSL 证书是可选的。

如果在 Cloud Pak for Data 上的 watsonx.data 实例上启用了 SSL ,并且该证书是自签名证书,那么必须在 SSL 证书 字段中输入该证书。

询问 watsonx.data 管理员是否设置了 SSL。 你可以在 watsonx.data 控制台的 配置 > 连接信息 > 实例详细信息 下找到 SSL 证书。

引擎连接详细信息

输入发动机连接详情

支持的引擎版本

对于 watsonx.data 上的 Cloud Pak for Data 版本 5.0.3 及更高版本:

  • Presto(Java)
  • Presto (C++)

对于 watsonx.data 上的 Cloud Pak for Data 版本 5.0.2 及之前的版本:

  • Presto(Java)

将 watsonx.data 作为服务:

  • Presto(Java)
  • Presto (C++)

提供这些引擎连接详细信息。 在 watsonx.data 网络控制台的 Configurations > Connection information > Engine and service connection details 下查找此信息。

  • 引擎的主机名或 IP 地址:主机名或 IP 地址是内部主机场地。

  • 引擎 ID :该值位于引擎 ID场地。

  • 发动机端口:端口号是内部主机冒号后的字段(: )。默认端口号为8443

根据您在平台中的位置选择创建连接的方法

在项目中
单击 资产> 新资产> 连接到数据源。 请参阅将连接添加到项目
在目录中
单击 添加到目录> 连接。 请参阅将连接资产添加到目录中
在平台资产目录中
单击新建连接。 请参阅添加平台连接

下一步:从连接添加数据资产

您可以在何处使用此连接

您可以在以下工作区和工具中使用 watsonx.data Presto 连接:

项目

  • Data Refinerywatsonx.aiStudio 或IBM Knowledge Catalog
  • DataStage (DataStage 服务)。 请参阅 连接到 DataStage中的数据源
  • Decision Optimization(watsonx.ai工作室和 "watsonx.ai运行时)
  • Metadata import (IBM Knowledge Catalog)

目录

  • Platform assets catalog

  • 其他目录 (IBM Knowledge Catalog)

将数据写入watsonx.data

您可以将数据导入watsonx.data和DataStage。 您必须输入catalog_nameschema_name , 和table_name特性。 table_name 属性为必填项。 您可以将全限定名称 catalog_name.schema_name.table_name 传递到 table_name 属性中。

watsonx.data Presto连接器直接在IBM watsonx.data 中定义的存储上创建 Iceberg 表。 目前,该连接器支持写入以下存储:

  • Amazon S3
  • Apache臭氧
  • IBMCeph
  • IBM Cloud Object Storage

watsonx.data Web 控制台

了解更多信息

相关连接

父主题: 支持的连接

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more