0 / 0
Go back to the English version of the documentation
Cloud Pak for Data 部署之间的功能差异
Last updated: 2024年12月19日
Cloud Pak for Data 部署之间的功能差异

Cloud Pak for Data as a Service 和 Cloud Pak for Data 软件在功能和实现方面存在一些差异。 Cloud Pak for Data as a Service 是一组 IBM Cloud 服务。 Cloud Pak for Data 5.1 以软件形式提供,您必须在 IBM Software Hub 上安装和维护。 与 Cloud Pak for Data 5.1 、 5.0 和 4.8 相比,两种部署上都有的服务在 Cloud Pak for Data as a Service 上的功能也有所不同。

平台差异

Cloud Pak for Data as a Service 和 Cloud Pak for Data 软件共享公共代码库,但是它们在以下关键方面有所不同:

平台差异
特征 即服务 软件
软件,硬件和安装 Cloud Pak for Data as a Service 完全由 IBM 在 IBM Cloud 上进行管理。 软件更新是自动的。 计算资源和存储器的扩展是自动的。 请登录 尝试 Cloud Pak for Data as a Service 您提供并维护硬件。 安装,维护和升级软件。 请参见软件要求
存储器 您配置了一个 IBM Cloud Object Storage 服务实例来提供存储。 请参见 IBM Cloud Object Storage 在 Red Hat OpenShift 集群上提供持久存储器。 请参见存储要求
用于运行工作负载的计算资源 用户为其作业选择相应的运行时。 将根据运行时环境的速率和作业持续时间对计算使用情况进行计费。 请参阅 监视帐户资源使用情况 使用相应数量的 vCPUs设置 Red Hat OpenShift 节点的数量。 请参阅硬件要求监控平台
成本 您可以在相应的套餐级别购买所需的每项服务。 许多计算资源消耗的服务帐单。 从导航菜单中选择 "服务 > 服务目录,查看 "IBM Cloud目录或 "Cloud Pak for Data as a Service服务目录中的每项服务页面。 您可以根据需要的服务购买软件许可证。 例如, Cloud Pak for Data Enterprise Edition许可证包括使用 watsonx.ai Studio 和 IBM Knowledge Catalog 等服务的权利。 参见许可证和权利
安全性,合规性和隔离 Cloud Pak for Data as a Service 的数据安全性,网络安全,安全标准合规性和隔离由 IBM Cloud管理。 您可以设置额外的安全性和加密选项。 请参阅 Cloud Pak for Data as a Service 的安全性 Red Hat OpenShift Container Platform 提供基本安全功能。 Cloud Pak for Data 根据各种隐私与合规性法规进行评估,并提供可用于准备各种隐私与合规性评估的功能。 您负责其他安全功能,加密和网络隔离。 请参阅安全注意事项
可用的服务 大多数数据光纤网服务在这两种部署环境中都可用。
请参阅 Services for Cloud Pak for Data as a Service
包含许多其他服务。 参见服务
用户管理 您可以使用 IBM Cloud Identity and Access Management添加用户和用户组,并管理其帐户角色和权限。 请参阅 将用户添加到帐户
您还可以在 IBM Cloud 上设置 SAML 联合。 请参阅 IBM Cloud 文档:IBM Cloud IAM 如何工作
您可以从 管理 菜单添加用户和创建用户组。 您可以使用 Identity and Access Management Service 或使用现有 SAML SSO 或 LDAP 提供程序进行身份和密码管理。 您可以创建基于属性的动态用户组。 请参见用户管理

跨服务的公共核心功能

平台提供的以下核心功能对于Cloud Pak for Data as a Service、 Cloud Pak for Data 软件 5.1、 5.0 和 4.8: 版本的服务实际上是相同的:

  • 跨平台全局搜索资产和工件
  • 平台资产目录,用于跨平台共享连接
  • 跨平台协作工作空间中基于角色的用户管理
  • 资产和工作空间的公共基础结构
  • 用于添加服务的服务目录
  • 管理 菜单查看计算使用情况

下表描述了 Cloud Pak for Data as a Service 与 Cloud Pak for Data 软件版本 5.1、 5.0 和 4.8 之间各服务核心功能的差异。

服务中公共功能的差异
特征 即服务 软件
管理所有项目 具有 IAM 服务访问 Manager 角色 IBM Cloud Pak for Data 的 Manage projects 权限的用户可以使用 Admin 角色加入任何项目,然后管理或删除项目。 具有 管理项目 许可权的用户可以加入任何具有 管理员 角色的项目,然后管理或删除该项目。
与远程数据源的连接
参见连接器
请参见支持的数据源
个人或共享的连接凭证 项目和目录中的连接可能需要个人凭证或允许共享凭证。 可以在帐户级别禁用共享凭证。 平台连接可能需要个人凭证或允许共享凭证。 可以在平台级别禁用共享凭证。
来自保险库中私钥的连接凭证 不可用 可用
Kerberos 认证 不可用 适用于某些服务和连接
资源中心应用程序中的样本资产和项目 可用 不可用
定制 JDBC 连接器 不可用 从 4.8.0 开始可用
数据源定义 不可用 从 5.0开始可用。
请参阅 使用数据源定义的数据保护

watsonx.aiStudio 与Watson Studio的比较

watsonx.ai Studio 在 Cloud Pak for Data as a Service 上的以下功能实际上与 Watson Studio 在 Cloud Pak for Data 软件上的功能相同,版本 5.1, 5.0, 和 。 4.8:

  • 项目和部署空间中的协作
  • 以编程方式访问项目资产
  • 使用项目 ZIP 文件导入和导出项目
  • Jupyter Notebook
  • 作业调度
  • Data Refinery
  • Watson Natural Language Processing for Python
  • 就文件和图像与基础模型聊天

本表描述了服务式部署环境中的watsonx.aiStudio服务与软件部署环境中的Watson Studio服务之间的功能差异、提供计划之间的差异以及是否需要额外服务。 有关 "Cloud Pak for Data as a Service上提供计划之间功能差异的更多信息,请参阅 "watsonx.ai工作室提供计划

watsonx.aiStudio 的差异
特征 即服务 软件
创建项目 创建:
空项目
来自资源中心中的样本的项目
来自文件的项目
创建:
空项目
文件中的项目
具有 Git 集成的项目
Git 集成 在 GitHub
上发布 Notebook 作为 Gist
将项目与 Git
同步资产到一个项目中的存储库,并将这些资产用于另一个项目
高级 Git 操作的项目终端 不可用 在具有缺省 Git 集成的项目中可用
使用文件夹在项目中组织资产 不可用 从 4.8.0 开始可用
JupyterLab 不可用 在具有 Git 集成的项目中可用
Visual Studio Code 集成 不可用 在具有 Git 集成的项目中可用
RStudio 无法与 Git 集成 可以与 Git集成。 需要 RStudio Server Runtimes 服务。
Python 脚本 不可用 在 JupyterLab中使用 Python 脚本。 需要 Watson Studio Runtimes 服务。
使用 Flight service 生成用于将数据装入到 Notebook 的代码 不可用 可用
管理 Notebook 生命周期 不可用 使用 CPDCTL 进行 Notebook 生命周期管理
代码包资产 (文件夹结构中的一组从属文件) 不可用 使用 CPDCTL 在部署空间中创建代码包资产
将 Notebook 提升到空间 不可用 从项目的 "资产" 页面手动提供,或者通过使用 CPDCTL 以编程方式提供
Python with GPU 仅可用于单个 GPU 类型的支持 支持多种 Nvidia GPU 类型。 需要 Watson Studio Runtimes 服务。
创建和使用定制映像 不可用 为 Python (带或不带 GPU)、R、 JupyterLab (带或不带 GPU)、 RStudio 和 SPSS 环境创建自定义镜像。 需要 Watson Studio Runtimes 和其他适用服务。
Anaconda 存储库 不可用 用于创建定制环境和定制映像
Hadoop 集成 不可用 构建和训练模型,并在 Hadoop 集群上运行 Data Refinery 流。 需要 Execution Engine for Apache Hadoop 服务。
Decision Optimization 可用 需要 Decision Optimization 服务。
SPSS Modeler 可用 需要 SPSS Modeler 服务。
编排管道 可用 需要 Orchestration Pipeline 服务。

watsonx.ai运行时与Watson Machine Learning比较

Cloud Pak for Data as a Service 上的以下 watsonx.ai Runtime 功能实际上与 Cloud Pak for Data 软件 5.1、 5.0 和 4.8: 版本上的 Watson Machine Learning功能相同:

  • 项目和部署空间中的协作
  • 部署模型
  • 部署函数
  • watsonx.ai Runtime REST API 和 Watson Machine Learning REST API
  • watsonx.ai Python 客户端
  • 创建联机部署
  • 扩展和更新部署
  • 定义和使用定制组件
  • 使用 Federated Learning 来训练具有单独且安全的数据源的公共模型
  • 跨空间监视部署
  • 用于测试联机部署的更新表单
  • 使用嵌套管道
  • AutoAI 数据插补
  • AutoAI 公平性评估
  • AutoAI 时间序列支持功能

本表介绍了服务型部署环境中的watsonx.aiRuntime 服务与软件部署环境中的Watson Machine Learning服务在功能上的差异、提供计划之间的差异以及是否需要附加服务。 有关 "Cloud Pak for Data as a Service上提供计划的功能差异详情,请参阅 "watsonx.ai运行时提供计划

watsonx.ai Runtime 部署之间的功能差异
特征 即服务 软件
AutoAI 训练输入 当前 受支持的数据源 支持的数据源 更改 (按发行版排列)
AutoAI 试验计算配置 不同的可用大小 不同的可用大小
AutoAI 对数据大小
和预测目标数的限制
设置限制 因计算配置而异的限制
AutoAI 增量学习 不可用 可用
使用常用框架
和软件规范进行部署
检查 支持的最新版本 支持的版本 因发行版而异
连接到数据库以进行批处理部署 检查 按部署类型支持 部署类型
和版本检查支持
部署 Python 脚本并对其评分 通过 Python 客户机提供 在 JupyterLab 或 Python 客户机中创建脚本,然后部署
部署和批处理评分 R 脚本 不可用 可用
部署 Shiny 应用程序 不可用 从代码包创建和部署 Shiny 应用程序
评估作业的公平性或漂移 需要 watsonx.governance 服务 需要 Watson OpenScale 或 watsonx.governance 服务
评估空间
中的联机部署以实现公平性,漂移或可解释性
不可用 可用
需要 Watson OpenScale 或 watsonx.governance 服务
评估空间中已部署的提示模板 可用
评估空间中已拆离的提示模板 不可用 从 5.0 开始可用
控制空间创建 无限制 (按角色) 使用许可权来控制可以查看和创建空间的人员
从 GIT 项目导入到空间 不可用 可用

从 Git 项目导入到空间时自动创建的代码包
不可用 可用
从代码包更新 RShiny 应用程序 不可用 可用
创建和使用定制映像 不可用 为 Python 或 SPSS 创建定制图像
通知合作者有关管道事件的信息 不可用 使用 "发送邮件" 通知合作者
深度学习试验 不可用 需要IBMScheduler 服务
供应和管理 IBM Cloud 服务实例 为watsonx.ai运行时
或Watson OpenScale添加实例
服务由管理员在集群
上供应

watsonx.governance

以下管理功能在 Cloud Pak for Data as a Service 和 Cloud Pak for Data 软件 5.1、 5.0 和 4.8: 版本中实际上是相同的:

  • 评估部署以实现公平性
  • 评估部署质量
  • 监视部署以进行漂移
  • 在 "洞察" 仪表板中查看和比较模型结果
  • 从您选择的机器学习提供程序添加部署
  • 设置要在求值低于指定阈值时触发的警报
  • 评估用户界面或 Notebook 中的部署
  • 定制评估和度量
  • 在模型概况介绍中查看有关评估的详细信息

本表介绍了watsonx.governance服务在即服务部署环境和软件部署环境中的功能差异、不同服务计划之间的差异以及是否需要附加服务。

watsonx.governance 部署之间的功能差异
特征 即服务 软件
评估机器学习模型
上载预评分测试数据 不可用 可用
IBM SPSS Collaboration and Deployment Services 不可用 可用
批处理 不可用 可用
支持按用户组进行访问控制 不可用 可用
免费数据库和 Postgres 套餐 可用 从 4.8 开始提供 Postgres

IBM Knowledge Catalog

下列功能在 IBM Knowledge Catalog on Cloud Pak for Data as a Service 和 Cloud Pak for Data 软件、版本 5.1, 5.0, 和 4.8:

  • 项目和目录中的协作
  • AI 支持的搜索和目录中的建议
  • 对目录中的资产进行评级和复审
  • 项目中的 Data Refinery 工具
  • 具有合作者角色的类别
  • 预定义和定制分类
  • 预定义和定制数据类
  • 监管规则
  • 策略
  • 数据保护规则
  • 数据质量 SLA 规则
  • 对项目或目录中的各个关系数据资产进行手动概要分析
  • 对添加到受管目录的关系数据资产进行自动概要分析
  • 项目中的元数据充实工具,用于对大型数据资产集进行剖析、术语分配、质量分析以及关键或关系分析
  • 定制资产类型,资产的定制属性以及目录中资产之间的定制关系
  • 监视工作流程任务
  • 在具有屏蔽流的项目中交付屏蔽数据集
  • 项目和目录中数据资产的详细数据质量信息,以及元数据丰富结果的一部分
  • 针对数据质量问题的补救工作流程
  • 使用 SQL 查询创建连接数据资产和分段数据资产
  • 运行元数据丰富工作的指标仪表板和执行窗口

此表描述了 IBM Knowledge Catalog 服务在即服务环境和软件部署环境中的功能之间的差异,产品套餐之间的差异以及是否需要其他服务。 有关 Cloud Pak for Data as a Service产品套餐之间的功能差异的更多信息,请参阅 IBM Knowledge Catalog 产品套餐

从 Cloud Pak for Data 版本 5.0 开始,您可以安装 IBM Knowledge Catalog Premium 盒或 IBM Knowledge Catalog Standard 盒,而不是 IBM Knowledge Catalog 服务。 IBM Knowledge Catalog Premium提供与IBM Knowledge Catalog服务相同的功能以及生成式人工智能功能。 IBM Knowledge Catalog Standard提供了IBM Knowledge Catalog功能的子集以及生成式人工智能功能。

IBM Knowledge Catalog的差异
特征 即服务 软件
项目中的 Metadata import 工具-发现 将数据资产导入到项目或目录中。 支持部分项目和目录连接。 请参阅 用于组织和数据质量的受支持数据源 导入不同类型的资产:
将数据资产导入到项目或目录中。 大多数受支持的连接在两个部署环境中都相同。
将商业智能报告,资产及其关联的变换脚本, ETL 作业或数据模型导入到目录中。 需要在没有许可证密钥的情况下安装 MANTA Automated Data Lineage 。 支持目录连接的子集。

请参阅 "支持的数据源管理和数据质量"。
项目中的 Metadata import 工具-沿袭
必须启用数据行。
每个计划的限制。
- 将数据资产序列导入目录。 需要安装带有许可证密钥的 IBM Manta Data Lineage 或 MANTA Automated Data Lineage。
- 下载 在 MANTA Automated Data Lineage 中捕获并访问 ETL 作业的脉络。

支持目录连接MANTA Automated Data Lineage。 请参阅 " 支持的数据源管理和数据质量 "。
利用生成式人工智能增强丰富性 可用。 不可用。
从 5.0 开始,请安装 IBM Knowledge Catalog Premium 或 IBM Knowledge Catalog Standard。
项目中的数据质量规则 可用的
需要 DataStage 服务。
可用。
需要 DataStage 服务。
使用文件将多个资产添加到目录 不可用。 可用。
资产活动 需要付费套餐。
在项目和目录中可用。
在项目和目录中可用。
业务沿袭 不可用 可用。
技术数据沿袭 不可用。
需要安装 MANTA Automated Data Lineage for IBM Cloud Pak for Data许可版本。 通过运行元数据导入工具生成。 可从目录访问。
数据沿袭 需要启用。 不可用。
业务术语 某些计划的限额。 可用。
预定义业务术语 只有在 2022 年 10 月 7 日之后使用精简版或标准版计划创建IBM Knowledge Catalog服务实例时,才能使用预定义的业务术语和包含这些术语的知识加速器样本个人数据类别。 不可用。
参考数据集 每个计划的限额。 可用。
人工制品的自定义关系 需要付费计划。 可用。
Knowledge Accelerators Requires an Enterprise plan.
Download from Resource hub.
随平台提供。
治理工件和请求的自定义工作流程配置 可用于治理人工制品。 可用。
自定义类别角色 每个计划的限额。 可用。
进出口数据保护规则 要从任何系统导出数据保护规则,并将规则导入同一系统或不同系统,可以使用应用程序接口。 有关详情,请参阅迁移数据保护规则 要从任何系统导出数据保护规则,并将规则导入同一系统或不同系统,可以使用 API 或 cpd-cli 命令。 有关详情,请参阅迁移数据保护规则
管理报告 需要付费计划。 可用。
从InfoSphere Information Server迁移数据 不可用。 可用。
“关系”资源管理器 不可用。 从 5.0开始可用。
需要安装IBM Knowledge Catalog的可选知识图谱组件。

DataStage

下表描述了 DataStage on Cloud Pak for Data as a Service 与 DataStage on Cloud Pak for Data 软件 5.1、 5.0 和 4.8 版本之间的功能差异。

DataStage 中的差异
特征 即服务 软件
PX 实例管理 您可以从一组预定义的大小供应实例。 您可以使用 Cloud Pak for Data 实例管理来更灵活地供应实例。
作业编译
  • OSH 在编译期间生成。
  • 在运行时编译变换器。
  • OSH 在编译期间生成。
  • Transformer 在编译期间编译,并且可供 /ds-storage 安装使用。
  • 编译以同步方式完成。
作业运行时 您可以根据需要提交任意数量的作业,以进行排队。
  • 支持并发作业运行。
  • 并行性由实例容量和 /px-storage/config/wlm.config.xml 文件中的设置确定。
资产管理 对于类型为 .xls , .xlsx , .xml 和 .json 的文件,仅支持简单结构。 无法解析多层/嵌套模式。 提供了对类型为 .csv , .txt , .xls , .xlsx , .xml 和 .json 的文件的完全支持。
存储器
  • POSIX类型的基于文件的实存储器不可用。
  • 存储器通过使用 Cloud Object Storage 项目存储区进行仿真。
  • 实存储器在 /px-storage/ds-storage中可用。
  • 您可以将更多存储器安装到 PX-runtime pod 中。 请参阅在DataStage中设置NFS挂载
Java Integration 阶段 可与DataStage-aaS一起在任何地方使用 可用
Java 库组件 可与DataStage-aaS一起在任何地方使用 可用
通用 JDBC 连接 可与DataStage-aaS一起在任何地方使用 可用
Excel 可与DataStage-aaS一起在任何地方使用 可用
AVI 可与DataStage-aaS一起在任何地方使用 可用
External Source 阶段 可与DataStage-aaS一起在任何地方使用 可用
External Target 阶段 可与DataStage-aaS一起在任何地方使用 可用
分层阶段
  • XML 解析器和 JSON 解析器的单个文件或文件集选项不可用。
  • XML Composer 和 JSON Composer 的单个文件,文件集和大对象选项不可用。
可用
SMP S , M , L 为单节点, SMP 配置。 使用远程运行时引擎来设置备用配置。 并行工作负载通过使用 APT_CONFIG_FILE 选项配置的逻辑分区进行管理。
SAP Bulk Extract 连接 不可用 可用
SAP Delta Extract 连接 不可用 可用
包装阶段 可与DataStage-aaS一起在任何地方使用 可用
SAP HANA 连接 不可用 可用
ODBC 连接中的文本数据源 不可用 可用
构建阶段 可与DataStage-aaS一起在任何地方使用 可用
使用前/后作业子例程发送报告 可与DataStage-aaS一起在任何地方使用 可用
定制阶段 可与DataStage-aaS一起在任何地方使用 可用
Apache HBase 连接 可与DataStage-aaS一起在任何地方使用 可用
Apache Hive 连接的 Kerberos 认证 不可用 可用
用户定义的函数 可与DataStage-aaS一起在任何地方使用 可用
用户创建的 APT_CONFIG_FILE 可与DataStage-aaS一起在任何地方使用 可用
作业前/作业后属性 可与DataStage-aaS一起在任何地方使用 可用
数据服务连接器 不可用 可用
"缓慢更改维度" 阶段, "代理键生成器" 阶段和 "变换器" 阶段中的 Db2 数据库序列 可与DataStage-aaS一起在任何地方使用 可用
将 Apache Hive 连接用作目标。 (在连接器中选择 使用 DataStage 属性 时可用。) 可与DataStage-aaS一起在任何地方使用 可用
使用本地连接参数化属性 不可用 可用
Operational Decision Manager 阶段 可与DataStage-aaS一起在任何地方使用 可用
部署空间 不可用 可用

Data Virtualization

在Cloud Pak for Data as a Service 上,数据虚拟化功能由Data Virtualization服务提供。 以下数据虚拟化功能在 Cloud Pak for Data as a Service 和 Cloud Pak for Data 软件 5.1、 5.0 和 4.8 版本上实际上是相同的。

  • 连接到受支持的数据源
  • 虚拟化数据
  • 使用策略和数据保护规则管理虚拟数据
  • 监视和探索服务
  • 使用 SQL 接口
  • 缓存
  • 列屏蔽
  • 浏览表的视图和重新装入表
  • 统计信息收集中的数据采样
  • 元数据扩充

以下 Data virtualization 功能在用户界面中似乎不同,但提供相同的基本功能:

本表介绍了 "Cloud Pak for Data as a Service软件上的 "Data Virtualization(原 "Watson Query)和 "Cloud Pak for Data软件上的 "Data Virtualization"(原 "Watson Query)在功能上的区别。

Data Virtualization的差异
特征 即服务 软件
使用 Cloud Pak for Data 数据源定义 (DSD) 来实施 IBM Knowledge Catalog 数据保护规则 不适用于 SaaS 从 5.0 开始可用
REST API 数据源中的查询数据 不适用于 SaaS 从 5.0 开始可用
具有多个目录支持的来自先前 Presto 和Data砌块目录的查询表 不适用于 SaaS 从 5.0 开始可用
自动缩放服务实例 不适用于 SaaS 从 5.0 开始可用
屏蔽多字节字符以增强敏感数据的隐私性 不适用于 SaaS 从 5.0 开始可用
查看应用于用户的数据保护规则 不适用于 SaaS 从 5.0 开始可用
增强了对 Data Virtualization 视图中的结果进行概要分析的安全性 不适用于 SaaS 从 5.0 开始可用
目录中的 Data Virtualization 连接现在引用平台连接 不适用于 SaaS 从 5.0 开始可用
目录中的 Data Virtualization 连接现在引用平台连接 不适用于 SaaS 从 5.0 开始可用
增强了 "管理员" 角色的安全性: "管理员" 角色没有对所有数据的缺省访问权。 不适用于 SaaS 从 4.8 开始可用
始终对 Watson Query 数据启用 IBM Knowledge Catalog 数据保护规则 不适用于 SaaS 从 4.8 开始可用
保护未受管对象: 通过 Watson Query中的 IBM Knowledge Catalog 数据保护规则,未在受管目录中发布的虚拟化对象将遵循规则设置中的 "缺省数据访问约定" 设置。 不适用于 SaaS 从 4.8 开始可用
查询 Presto 数据: 您可以创建与 Presto 的连接,以访问和查询 Presto中的数据。 不适用于 SaaS 从 4.8 开始可用
审计日志记录以监视用户活动和数据访问 可用 可用
与 IBM Knowledge Catalog 集成 必需 可选
组的基于组的授权和对象级别访问权 不可用 可用
支持远程连接器 不适用于 SaaS 可用
支持基于文件系统的数据源, Cloud Object Storage 除外 不适用于 SaaS 可用
连接到需要上载的 JDBC 驱动程序的数据源,例如, SAP HANA,通用 JDBC 不适用于 SaaS 可用
在用户界面中收集统计信息 不可用 可用
对象虚拟化期间的自动统计信息收集 不可用 可用
多个组的访问权管理 不可用 可用
支持 Cloud Object Storage 中的 CSV 或 TSV 文件 不适用于 SaaS 可用
Cloud Object Storage 中连接的保险库文件中的凭证 不适用于 SaaS 可用
自动缓存查询 不可用 从 5.0.3 开始提供

了解更多信息

父主题: Cloud Pak for Data as a Service

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more