0 / 0
Go back to the English version of the documentation
常见问题及解答
Last updated: 2024年11月28日
常见问题及解答

查找有关 Cloud Pak for Data as a Service的常见问题的答案。

帐户和设置问题

Cloud Pak for Data as a Service 问题

弃用

请参阅服务套餐更改和弃用

项目问题

IBM Cloud Object Storage问题

IBM Knowledge Catalog 问题

笔记本问题

安全性和可靠性问题

共享和协作问题

机器学习问题

Watson OpenScale 问题

帐户和设置

如何注册 Cloud Pak for Data as a Service?

转至 Cloud Pak for Data as a Service

对于其他区域中的 URL ,请参阅 区域可用性

可以免费试用 Cloud Pak for Data as a Service 吗?

是,当您注册 Cloud Pak for Data as a Service时,将自动供应某些免费服务的轻量版本。 许多服务都有免费的轻量套餐。 转至 Cloud Pak for Data as a Service

如何获取watsonx.aiStudio 的免费版本?

如果您已注册 Cloud Pak for Data as a Service,请在主页上找到 快速入门 部分,然后单击 构建和管理 ML 模型。 然后,点击Provisionwatsonx.aiStudio。 如果您没有看到配置watsonx.aiStudio 的选项,说明您已经配置了它。

您还可以转至服务目录以供应轻量套餐。 打开导航菜单,选择服务 > 服务目录,然后选择watsonx.aiStudio。 如果未看到用于创建轻量套餐的 创建 按钮,那么您已有轻量套餐。

您只能为watsonx.aiStudio 提供一个精简版计划。 参见watsonx.ai工作室计划

如 "IBM Cloud文档:管理对资源的访问所述,您还需要对账户资源拥有适当的访问权限。

我可以提供反馈吗?

是的,当我们继续开发此平台时,我们鼓励反馈。 从导航菜单中,选择 支持> 共享构想

当我尝试提供watsonx.aiStudio 时,为什么 "创建 "按钮被禁用?

如果您的账户中已有watsonx.aiStudio Lite 实例,或者您没有选择许可协议复选框,则创建按钮不可用。

如果您使用的是watsonx.aiStudio的精简版计划,您只能创建一个服务实例。 您可以在 " 资源列表 " 页面上的 IBM Cloud 控制台中查看现有服务。 或者,从 Cloud Pak for Data as a Service中,打开导航菜单并选择 服务> 服务实例

参见watsonx.ai工作室计划

为什么我无法访问watsonx.aiStudio?

如果您无法访问watsonx.aiStudio,请检查您是否满足以下条件:

  1. 您已登录到 IBM Cloud 帐户。

  2. 对于该账户,watsonx.aiStudio 服务是通过IBM Cloud目录 Cloud Pak for Data as a Service目录提供的。 watsonx.ai工作室服务实例列在 "IBM Cloud资源下或 "Cloud Pak for Data as a Service中的 "服务实例下。 如果未列出watsonx.aiStudio,请配置一个新实例。

  3. watsonx.aiStudio 服务实例可能列在另一个IBM Cloud帐户下。 如果您是多个 IBM Cloud 帐户的成员,请 切换帐户 以在其他帐户下检查服务实例。

  4. 确保您拥有访问watsonx.aiStudio 的正确权限。 您的帐户管理员将授予必需的许可权。 有关角色和许可权的描述,请参阅 Cloud Pak for Data as a Service

  5. 您访问的watsonx.aiStudio服务使用的是您的服务提供区域的链接。 请检查 区域限制 ,以获取有关您所在区域当前不可用的功能的信息。 以下是每个区域的 Cloud Pak for Data as a Service 链接:

为什么我无法查看跨区域的所有项目和目录?

对于某些服务计划,您可以在多个IBM Cloud服务区域配置watsonx.aiStudio 和IBM Knowledge Catalog服务。 但是,您的项目、目录和数据特定于它们所保存在的区域,并且只能从该区域的服务来访问它们。 您必须切换区域才能查看该区域的项目、目录和数据。

如何升级?

当您准备好升级在 Cloud Pak for Data as a Service中创建的任何服务时,可以就地升级,而不会丢失任何工作或数据。

您必须是 IBM Cloud 服务帐户的所有者或管理员才能对其进行升级。 请参阅 升级 Cloud Pak for Data as a Service 和服务

我的Watson Studio和Watson Machine Learning服务怎么了?

Watson Studio服务现命名为watsonx.aiStudio。 Watson Machine Learning服务现命名为watsonx.aiRuntime。

要使用watsonx.aiStudio和watsonx.aiRuntime服务开发带有基础模型的生成式人工智能解决方案,您必须注册watsonx.ai。

如何获得 IAM 编辑者角色,以便可以供应服务实例?

如果尝试供应服务实例 (例如, Watson OpenScale 服务) ,那么可能会收到以下错误消息:

您不具备创建实例所需的许可权。 您必须分配有 IAM 编辑者角色、 操作员角色或更高级别的角色。 请联系帐户所有者以更新您的访问权。

要获得 IAM 编辑者角色,请执行下列操作:

  1. 查找您的 IBM Cloud 帐户所有者或管理员
  2. 请求分配 IAM 编辑者 角色(针对资源组)。

如何从我的watsonx.aiStudio Lite计划中获得最多的运行时间?

watsonx.aiStudio Lite 计划每月可使用 10 CUH。 您可以通过将资产设置为使用具有较低 CUH 速率的环境来最大化可用 CUH。 例如,可以 更改 Notebook 环境。 要查看可用环境和所需的 CUH,请访问 watsonx.aiStudio 的服务目录页面

如何查找我的 IBM Cloud 帐户所有者?

如果您拥有企业帐户或在您不拥有的 IBM Cloud 中工作,那么可能需要请求帐户所有者授予您对工作空间或其他角色的访问权。

要查找您的 IBM Cloud 帐户所有者,请执行下列操作:

  1. 从导航菜单中,选择 管理> 访问权 (IAM)
  2. 从头像菜单中,确保您在正确的帐户中,或者在必要时切换帐户。
  3. 单击 用户,然后找到旁边有 owner 字样的用户名。

要了解角色,请参阅 Cloud Pak for Data as a Service 的角色。 要确定您的角色,请参阅确定角色

Cloud Pak for Data as a Service

什么是 Cloud Pak for Data as a Service?

Cloud Pak for Data as a Service 为一组核心 IBM Cloud 服务及其相关服务提供了单个统一界面。 核心服务包括 "watsonx.ai工作室、"watsonx.ai运行时、"Watson OpenScale、"IBM Knowledge Catalog"、"Data Virtualization"、"DataStage,"和 "Match 360。 您可以添加其他服务来存储数据或开发 Watson 应用程序。

请参阅 Cloud Pak for Data as a Service 概述

为什么我的产品名称更改为 Cloud Pak for Data as a Service?

您的产品名称变为 "Cloud Pak for Data as a Service,是因为您拥有 "watsonx.aiStudio、"watsonx.aiRuntime 或 "IBM Knowledge Catalog,以及 "Cloud Pak for Data as a Service服务目录中的另一项服务,如 "DataStage。 服务的功能、套餐和成本没有改变。

请参阅 watsonx.aiStudio 与IBM Knowledge Catalog服务和Cloud Pak for Data as a Service之间的关系

watsonx.aiStudio 和Cloud Pak for Data as a Service 有什么区别?

watsonx.aiStudio是一项单一服务,而Cloud Pak for Data as a Servicea Service则是一系列服务的平台,其中包括作为核心服务之一的watsonx.aiStudio。 两种情况下,watsonx.aiStudio 的功能都是一样的。

请参阅 Cloud Pak for Data as a Service 概述

Cloud Pak for Data 4.x 与 Cloud Pak for Data as a Service有何区别?

Cloud Pak for Data 4.x 是必须安装和维护的软件,而 Cloud Pak for Data as a Service 是由 IBM完全管理的一组 IBM Cloud 服务。 Cloud Pak for Data 4.x 具有预定发行版和不同版本。 Cloud Pak for Data as a Service 每周自动更新,并且没有版本号。

请参阅 Cloud Pak for Data 部署之间的功能差异

Cloud Pak for Data as a Service 有预订套餐吗?

是,Cloud Pak for Data as a Service 有预订套餐。 请参阅升级到 Cloud Pak for Data as a Service 预订帐户

Cloud Pak for Data as a Service 支持哪些连接?

Cloud Pak for Data as a Service 支持许多数据源。 请参阅 连接器 (Connectors)

项目

在哪里开始watsonx.aiStudio 的新项目?

登录 Cloud Pak for Data as a Service 以转至主页。 单击 创建项目 链接。

您可以通过打开导航菜单并在 项目 部分中选择 查看所有项目 来查看所有项目。

观看有关创建项目的视频,以了解如何创建空白项目以及通过文件创建项目。

为什么无法从导出的 .zip 项目文件创建项目?

如果您看到一个错误,指出 .zip 文件不包含项目,那么您可能正在尝试从其他平台导入 .zip 文件。

仅当您选择的 .zip 文件已从 Cloud Pak for Data as a Service 项目导出为压缩文件时,才能从本地系统上的文件导入项目。 您不能导入从 IBM Cloud Pak for Data 项目中导出的压缩文件。

请参阅导入项目

如何将超大文件加载到项目中?

无法将大于 5 GB 的数据文件装入到项目中。 如果文件超过此大小,那么必须使用 Cloud Object Storage API 并将数据分为多个部分进行加载。 请参阅 curl 命令,以直接在 IBM Cloud 上使用 Cloud Object Storage。

请参阅 将非常大的对象添加到项目的 Cloud Object Storage

如何选择要使用的工具?

您需要的工具取决于您的数据类型,您希望对数据执行的操作以及您需要的自动化程度。 要找到合适的工具,请参阅选择工具

IBM Cloud Object Storage

工作区的 IBM Cloud Object Storage中保存了什么?

创建项目、部署空间或目录时,指定 IBM Cloud Object Storage 并创建专用于该工作区的存储桶。 这些类型的对象存储在工作区的 IBM Cloud Object Storage桶中:

  • 您上载到工作空间中的数据资产的文件。
  • 与工具中运行的资产相关的文件,如笔记本和模型。
  • 有关资产的元数据,例如,资产描述、标记以及注释或复审。

升级其他服务时,是否需要升级 IBM Cloud Object Storage?

仅当存储空间不足时,才必须升级 IBM Cloud Object Storage 实例。 其他服务可以使用任何 IBM Cloud Object Storage 计划,您可以独立升级任何服务或您的 IBM Cloud Object Storage 服务。

为什么无法将存储器添加到现有项目,或者在“新建项目”对话框中看不到 IBM Cloud Object Storage 选项?

如果用户对于 IBM Cloud Object Storage 没有管理特权,则会要求用户执行额外一个步骤。 帐户管理员必须 允许非管理用户创建项目

如果您具有管理员特权,但是没有看到最新的 IBM Cloud Object Storage,那么请稍后再试,因为服务器端高速缓存可能会导致延迟呈现最新值。

IBM Knowledge Catalog

什么是 IBM Knowledge Catalog?

IBM Knowledge Catalog 是基于云的企业元数据存储库,允许您对知识和分析资产 (包括结构化和非结构化数据,无论它们位于何处) 进行编目,以便可以轻松访问这些资产并将其用于推动数据科学和 AI。 对于所选源类型, IBM Knowledge Catalog 可以在提供的连接上自动发现和注册数据资产。 将资产添加到目录之后,会自动对它们建立索引和进行分类,从而使诸如数据工程师、数据研究员、数据管理员和业务分析师等用户可以轻松找到、理解、共享和使用资产。 基于 AI 的搜索和建议可根据对资产之间的关系、如何使用这些资产以及用户之间的社会关系的了解,将用户引导到目录中相关度最高的资产。

IBM Knowledge Catalog 还提供了一个智能且强大的监管框架,允许您定义和实施数据和访问策略,以确保正确的数据提供给正确的人员。

通过 IBM Knowledge Catalog的业务术语,用户可以创建公共业务词汇表并将其与资产,策略和规则相关联,从而提供业务域与技术资产之间的桥梁。

目录与项目之间有什么区别?

在目录中,可以共享整个企业中的资产。 在项目中,您可以处理小型团队的资产。 企业目录可以有数千个资产与数百个用户共享。 项目是为一个合作团队而设计的,团队成员可利用一些资产来实现特定目标,如使用watsonx.aiStudio 开发人工智能模型或数据准备。

支持哪些数据源和资产类型?

IBM Knowledge Catalog 支持超过 50 个连接器到云或本地数据源类型。 请参阅 连接器 (Connectors)

IBM Knowledge Catalog 还支持其他资产类型,例如结构化数据,非结构化数据,模型和笔记本。

如何将超大文件加载到目录中?

无法从 IBM Knowledge Catalog将大于 5 GB 的数据文件装入到目录中。 要将大于 5 GB 的文件添加到目录中,请将文件上载到 IBM Cloud Object Storage,然后将其添加为已连接的数据资产

我是否需要将数据移动到 IBM Knowledge Catalog中?

不需要,您可以将所有数据保留在它们的现有存储库中,也可以将本地文件上载到与目录相关联的 IBM Cloud Object Storage 中。 如何选择由您自己决定。

IBM Knowledge Catalog 仅存储和管理资产的元数据。

我可以在目录中拥有的最大资产数是多少?

所有目录中可包含的资产数量取决于您的套餐:

  • Lite 套餐:50 项资产(连接除外)和不限数量的连接资产
  • 标准套餐 (从 2022 年 5 月 2 日开始): 不受限制的资产
  • 企业捆绑套餐 (从 2022 年 5 月 02 日开始): 无限资产

如果在 2022 年 5 月 2 日之前供应了计划,那么有以下限制:

  • 传统标准套餐: 500 个资产
  • 传统企业套餐: 无限资产
  • Legacy Professional 套餐: 无限资产

请参阅 IBM Knowledge Catalog 产品套餐

IBM Knowledge Catalog 是否提供策略服务?

IBM Knowledge Catalog 包含一个自动化策略实施引擎,用于根据策略和执行的操作来确定结果。 通过 IBM Knowledge Catalog,您可以在系统中设置策略,并根据定义的策略限制对数据的访问。

IBM Knowledge Catalog 是否提供分类服务?

对于使用数据保护规则实施创建的受管目录, IBM Knowledge Catalog 会在关系数据资产添加到目录时自动对其中的列进行分类。 为列提供了超过 160 个数据类,包括姓名,电子邮件,邮政地址,信用卡号,驾照,政府身份证号,出生日期,人口信息, DUNS 号等。 对于未实施数据保护规则的非管理目录,用户可以选择对关系数据资产进行分类或概要分析,但是不会自动对资产进行分类。 目录还会对非结构化数据资产进行概要分析。 请参阅对资产进行概要分析

IBM Knowledge Catalog 是否具有数据角力功能?

是的, Data Refinery中提供了数据准备功能,这是 IBM Knowledge Catalog的一部分。 Data Refinery 提供了一系列丰富的功能,这些功能不仅允许您使用内置操作来发现、清理和变换数据,而且还提供了功能强大的概要分析和可视化工具(例如,图表和图形),可帮助您与数据交互和了解数据。

IBM Knowledge Catalog 中定义的数据访问和变换策略也在 Data Refinery 中实施,以确保源自受管目录的敏感数据保持受保护。

我是否可以为不同业务线和角色的人员设置访问组?

可以通过您的 IBM Cloud 帐户在“身份和资产管理 (IAM)”区域中设置访问组。

在设置访问组之后,在目录的“访问控制”页面上,可以添加访问组,以便访问组的所有成员都可以使用相同的许可权访问目录。 请参阅添加访问组

IBM Knowledge Catalog 是否将 Apache Atlas 用于其元数据存储库?

IBM Knowledge Catalog 将其自己的本地存储用于元数据。

IBM Knowledge Catalog 在云本机持久性存储上运行,可满足平台对性能,正常运行时间和可伸缩性的需求。

从目录或项目添加资产,或者将资产从项目发布到目录时,项目和目录都必须满足以下条件:

  • 您与目录所有者必须是 IBM Cloud 中的同一 Cloud Pak for Data as a Service 帐户的成员,或者,如果贵公司在 IBM Cloud 上设置了 SAML 联合身份认证,那么您与目录所有者必须属于同一家公司。
  • 如果要将目录资产添加到项目,那么必须选择限制谁可以成为项目中的合作者。 如果要将资产发布到目录,那么不需要限制项目。
  • 创建项目时,您必须选择 IBM Cloud Object Storage。 您必须是 IBM Cloud Object Storage 实例的所有者,或者必须将 IBM Cloud Object Storage 实例配置为允许创建项目。

在目录屏幕中,将资产添加到项目时目标项目的下拉列表仅列出满足所有这些条件的项目。

在我创建数据保护规则后,数据保护规则将应用于哪些目录?

数据保护规则的作用域仅限于 IBM Cloud 帐户,并且将对与数据保护规则属于同一 IBM Cloud 帐户的所有管理目录中的资产实施该规则。

数据保护规则是否会影响外部数据源中的数据?

否, IBM Knowledge Catalog 是用于搜索数据的数据目录。

数据保护规则仅影响数据在目录中的显示方式。 数据保护规则不会影响直接访问外部数据源的用户。

为什么无法添加策略或其他监管工件?

您必须具有专门的许可权才能创建监管工件,例如策略、业务术语、数据类、规则和参考数据集。 您还必须是某个类别的成员,并具有有权在该类别中创建工件的角色。 请参阅管理监管工件

Notebook

是否可以安装库或包以在我的 Notebook 中使用?

您可以通过 Notebook 安装 Python 库和 R 包,这些库和包将可用于使用同一环境模板的所有 Notebook。 有关指示信息,请参阅导入定制库或第三方库。 如果在安装库或软件包时迂到有关缺少操作系统依赖关系的错误,请通知 IBM 支持人员。 要查看预安装的库和包以及您已安装的库和包,请从 Notebook 中运行相应的命令:

  • Python!pip list
  • R: installed.packages()

我是否可以从另一个 Notebook 调用在一个 Notebook 中定义的函数?

无法从平台上的另一个 Notebook 调用一个 Notebook。 但是,您可以将公共代码放入平台外部的库中,然后进行安装。

是否可以添加任意 Notebook 扩展?

否,无法通过添加任意扩展作为定制来扩展 Notebook 功能,因为必须预安装所有 Notebook 扩展。

如何在 Notebook 中访问 CSV 文件中的数据?

将 CSV 文件加载到对象存储中后,在打开的笔记本中单击代码片段图标 "alt="",单击读取数据并从项目中选择 CSV 文件,即可加载数据。 然后,单击 Notebook 中的空代码单元格,并插入生成的代码。

如何在 Notebook 中访问压缩文件中的数据?

将压缩文件加载到对象存储空间后,在打开的笔记本中单击代码片段图标 "alt="",单击读取数据并从项目中选择压缩文件,即可获取文件凭据。 然后,单击 Notebook 中的空代码单元格,并将凭证装入到该单元格中。 或者,单击以将凭证复制到剪贴板并将其粘贴到 Notebook 中。

安全性和可靠性

Cloud Pak for Data as a Service 的安全性如何?

Cloud Pak for Data as a Service 平台非常安全且具有弹性。 请参阅 Cloud Pak for Data as a Service 的安全性

我的数据和笔记本是否受到保护,不会在我的合作者之外进行共享?

装入到项目和 Notebook 中的数据是安全的。 只有项目中的合作者才能访问您的数据或 Notebook。 每个平台账户都是 Spark 和 IBM Cloud Object Storage服务的独立租户。 租户无法访问其他租户的数据。

如果您想要与公众共享 Notebook,请在 Notebook 中隐藏数据服务凭证。 对于 Python 和 R 语言,请输入以下语法: # @hidden_cell

请确保在输入语法之后就立即保存 Notebook,以隐藏具有敏感数据的单元格。

然后才能共享您的工作。

我是否需要备份 Notebook?

编号 您的笔记本存储在IBM Cloud Object Storage中,该存储提供了防止中断的弹性。

共享和协作

共享 Notebook 意味着什么?

当您共享 Notebook 时,永久链接从不会更改。 任何具有该链接的人员都可以查看您的 Notebook。 您可以通过取消选中用于共享 Notebook 的复选框来停止共享该 Notebook。 不会自动共享更新。 更新 Notebook 时,可以通过重新选中用于共享该 Notebook 的复选框来同步该共享 Notebook。

如何在 RStudio 外部共享我的工作?

在 RStudio 外部共享工作的一种方法是将其连接到您和合作者可以使用的共享 GitHub 存储库。 请阅读此博客帖子以了解更多信息。

但是,与项目成员共享工作的最佳方法是在使用 R 内核的项目中使用 Notebook。

RStudio 是一个非常好的环境,可以在 R 项目上进行原型设计和单独工作,但它尚未与项目集成。

如何与另一个项目共享 SPSS Modeler 流程?

根据设计,建模器流只能在创建或导入流的项目中使用。 如果需要在其他项目中使用建模器流,那么必须将流程从当前项目(源项目)下载到本地环境,然后将该流程导入到另一个项目(目标项目)。

IBM watsonx.ai运行时

如何运行 AutoAI 试验?

访问从样本数据创建 AutoAI 试验以观看一个短视频,了解如何创建和运行 AutoAI 试验,然后遵循教程来建立您自己的样本。

有什么可用于自动模型构建?

AutoAI 图形工具会自动分析数据并生成针对预测建模问题定制的候选模型管道。  在 AutoAI 分析数据集并发现最适合您的问题设置的数据变换、算法和参数设置时,将迭代创建这些模型管道。 结果会显示在排行榜上,以显示自动生成的模型管道,并根据您的问题优化目标进行排名。 有关详细信息,请参阅 AutoAI 概述

我的机器学习模型支持哪些框架和库?

通过使用IBM watsonx.aiRuntime,您可以使用流行的工具、库和框架来训练和部署机器学习模型。 受支持的框架主题列示了受支持的版本和功能,以及已计划不再使用的弃用版本。

什么是 API 键?

当使用可以跨多项服务使用的 CLI 或 API 时,API 键允许您轻松进行认证。 API 键被视为机密,因为它们用来授予访问权。 请将所有 API 键视为密码,因为任何具有您的 API 键的用户都可以假冒您的服务。

Watson OpenScale

什么是 Watson OpenScale

IBM Watson OpenScale 可以跟踪并测量 AI 模型的结果,并帮助确保这些模型保持公平、可解释并合规,而无论模型构建于何处或在何处运行。 Watson OpenScale 还可以检测并帮助校正 AI 模型在生产过程中的准确性漂移。

Watson OpenScale 如何定价?

标准 定价套餐按模型收取统一费用,而对于可解释性的有效内容,反馈行或交易数量没有任何限制。 IBM Cloud 目录中提供了最新信息。

Watson OpenScale 是否有免费试用版?

Watson OpenScale 提供有免费试用计划。 要注册,请参阅 Watson OpenScale Web 页面,然后单击立即开始。 如果您愿意,可以使用免费计划(每个月的使用量有限制,使用量每月更新一次)。

Watson OpenScale 在 IBM Cloud Pak for Data 上是否可用?

Watson OpenScale 是 IBM Cloud Pak for Data 所包含的服务之一。

如何将预测列从整数数据类型转换为分类数据类型?

对于公平性监视,该预测列只允许使用整数数值,即使预测标签为分类标签也是如此。 如何配置并非整数的分类特征? 是否需要进行手动转换?

训练数据可能包含“Loan Denied”和“Loan Granted”之类的类标签。 IBM watsonx.aiRuntime 评分终点返回的预测值有 "0.0"、"1.0"等值。 该评分端点还有一个可选列,其中包含该预测的文本表示。 例如,如果 prediction=1.0,那么 predictionLabel 列中的值可能是“Loan Granted”。 如果有这样的列可供使用,那么在为该模型配置有利结果和不利结果时,请指定字符串值“Loan Granted”和“Loan Denied”。 如果没有这样的列可供使用,那么您需要为有利类和不利类指定整数值/双精度值 1.0 和 0.0。

IBM watsonx.aiRuntime 有一个输出模式的概念,它定义了IBM watsonx.aiRuntime 评分终点的输出模式和不同列的作用。 角色用于标识哪个列包含预测值,哪个列包含预测概率以及类标签值等。 将自动为使用模型构建器创建的模型设置输出模式。 也可以使用IBM watsonx.aiRuntimePython客户端进行设置。 用户可以使用输出模式来定义一个包含该预测的字符串表示的列。 请将该列的 modeling_role 设置为“decoded-target”。 阅读[watsonx.aiRuntimePython客户端库文档]。 请搜索“OUTPUT_DATA_SCHEMA”以了解输出模式,要使用的 API 是 store_model API,它接受 OUTPUT_DATA_SCHEMA 作为参数。

Watson OpenScale 为何需要访问训练数据?

必须授权 Watson OpenScale 访问存储在 Db2 或 IBM Cloud Object Storage 中的训练数据,否则必须运行 Notebook 来访问训练数据。

因为下列原因,Watson OpenScale 需要访问训练数据:

  • 生成对比说明:要创建解释,需要访问训练数据的统计信息,例如中值、标准差和不同值。
  • 显示训练数据统计信息:要填充偏差详细信息页面,Watson OpenScale 必须要有从中生成统计信息的训练数据。
  • 构建漂移检测模型:漂移监视器使用训练数据来创建和校准漂移检测。

在基于 Notebook 的方法中,您应该在 Watson OpenScale 中配置部署时上载统计信息和其他信息。 Watson OpenScale 不再能够访问位于环境中运行的 Notebook 外部的训练数据。 它只能访问配置期间上载的信息。

公平性分数高于 100% 意味着什么?

根据公平性配置,公平性分数可能会超过 100%。 这意味着与参考组相比,受监视组所获得的结果相对更“公平”。 从技术角度而言,这意味着该模型在相反方向上不公平。

使用 Watson OpenScale 如何缓解模型偏差?

Watson OpenScale 中的除偏功能是企业级功能。 该功能稳健、可伸缩,并可以处理各种模型。 Watson OpenScale 中的除偏是两个步骤的过程:学习阶段:学习客户模型行为,以了解其行为何时有偏差。

应用阶段:识别客户模型在特定数据点的行为是否有偏差,如果需要,可纠正偏差。 有关更多信息,请参阅除偏选项

是否可以按种族和性别等敏感属性检查模型是否有偏差,即使模型未按这些属性进行训练也是如此?

是。 最近,Watson OpenScale 已发布称为“间接偏差检测”的突破性功能。 使用该功能可以检测模型在敏感属性上是否间接出现偏差,即使该模型未按这些属性进行训练也是如此。

基于回归的模型是否可以缓解偏差?

是。 您可使用 Watson OpenScale 来缓解基于回归的模型上的偏差。 使用此功能不需要额外的配置。 回归模型的偏差缓解功能在模型出现偏差时现成可用。

在 Watson OpenScale 中有哪些不同的除偏方法?

您可使用主动除偏和被动除偏进行除偏。 有关更多信息,请参阅除偏选项

配置模型需要有关训练数据位置的信息,选项包括 Cloud Object Storage 和 Db2。 如果该数据在 Netezza 中,Watson OpenScale 可以使用 Netezza 吗?

使用此 Watson OpenScale Notebook 从 Netezza 读取数据,并生成训练统计数据以及漂移检测模型。

为什么 Watson OpenScale 无法查看对模型进行的更新?

Watson OpenScale 使用模型的部署,而非该模型本身。 您必须创建新部署,然后在 Watson OpenScale 中,将这个新部署配置为新预订。 通过这种安排,就可以对该模型的两个版本进行比较。

使用机器学习模型会带来哪些风险?

与机器学习模型相关联的多种风险,例如输入数据的任何变化(也称为漂移),都可能导致模型做出不准确的决策,从而影响业务预测。 训练数据可以进行清理以消除偏差,但运行时数据可能会引起模型的偏差行为。

传统的统计模型容易解释和说明,但无法解释机器学习模型结果可能会给模型的使用造成严重威胁。

有关更多信息,请参阅管理模型风险

我是否必须一直监视 Watson OpenScale 仪表板以确保模型行为符合预期?

否,您可以在 Watson OpenScale中为生产模型部署设置电子邮件警报。 每当风险评估测试失败时,您都会收到电子邮件警报,然后您可以来检查问题并解决这些问题。

在 Watson OpenScale 中,哪些数据用于计算质量指标?

质量指标是使用手动标注的回馈数据以及该数据的受监视部署响应来计算。

在 Watson OpenScale中,可以在配置期间为除 "ROC 下的面积" 以外的度量设置阈值吗?

否,当前只能为 "ROC 下的面积" 度量设置阈值。

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more