0 / 0
Go back to the English version of the documentation
AI 监管教程: 测试和验证模型
Last updated: 2024年11月28日
AI 监管教程: 测试和验证模型

学习本教程,以评估和监控在 "构建和部署模型教程 "中使用人工智能治理用例构建和部署的模型。 您的目标是使用 Watson OpenScale 来配置和评估用于预测哪些申请人符合抵押贷款条件的已部署模型的监视器。 您希望确保模型准确,并公平对待所有申请人。

该教程的故事是, Golden Bank 希望通过为在线应用提供低利率抵押贷款续约来扩展其业务。 在线申请扩大了银行的客户范围,降低了银行的申请处理成本。 作为 Golden Bank 的数据科学家,您必须创建一个抵押贷款审批模型,以避免意外风险,并公平对待所有申请人。 您将运行 Jupyter 笔记本,为机器学习模型设置监控器,这样您就可以放心地将它们部署到生产中,确保它们按照预期有效运行。 这项任务通过 Cloud Pak for Data 服务来完成,这些服务共同提供了对数据的信任、对模型的信任以及对流程的信任,这些都是可靠运行人工智能所必需的。

以下动画图像提供了在教程结束时将完成的内容的快速预览。 单击该图像以查看更大的图像。

动画图像

预览教程

在本教程中,您将完成以下任务:

观看视频观看视频,预览本教程的步骤。

此视频提供了一种可视方法来学习本文档中的概念和任务。





完成本教程的提示
以下是成功完成本教程的一些提示。

使用视频图片

提示: 启动视频,然后当您在教程中滚动时,视频将移至画中画方式。 关闭视频目录以获取最佳图片体验。 您可以使用图片-图片方式,以便在完成本教程中的任务时可以关注视频。 单击要继续执行的每个任务的时间戳记。

以下动画图像显示了如何使用视频图片和目录功能:

如何使用图片和章节

在社区中获取帮助

如果您需要本教程的帮助,可以在Cloud Pak for Data社区讨论区提问或寻找答案。

设置浏览器窗口

为了获得完成本教程的最佳体验,请在一个浏览器窗口中打开 Cloud Pak for Data ,并在另一个浏览器窗口中保持本教程页面处于打开状态,以便在两个应用程序之间轻松切换。 请考虑将两个浏览器窗口并排排列,以便更轻松地进行后续操作。

并排教程和 UI

提示: 如果在用户界面中完成本教程时迂到引导式教程,请单击 稍后可能



设置先决条件

完成 构建和部署模型 教程

预览教程视频 To preview this task, watch the video beginning at 00:47.

完成 构建和部署模型 教程,以创建,提升和部署本教程中使用的机器学习模型。

供应服务

预览教程视频 To preview this task, watch the video beginning at 01:14.

重要信息: Watson OpenScale 仅在达拉斯和法兰克福区域可用。 完成构建和部署模型教程后,您应该正在使用达拉斯区域。 如果需要,请先切换到达拉斯区域,然后再继续。

除了完成 构建和部署模型教程所需的服务外,您还需要供应 Watson OpenScale 服务。 请遵循以下步骤来验证或供应必需的服务:

  1. 在 Cloud Pak for Data中,验证您是否位于达拉斯区域中。 如果没有,请单击区域下拉菜单,然后选择达拉斯
    更改区域

  2. 导航菜单"导航菜单,选择服务 > 服务实例

  3. 查看服务列表以确定是否存在 watsonx.governance 或 Watson OpenScale 服务实例。

  4. 如果需要创建 watsonx.governance 服务实例,请单击 添加服务

  5. 选择 watsonx.governance。 请注意, watsonx.governance 包含 Watson OpenScale。

    1. 对于区域,选择 达拉斯

    2. 选择轻量套餐。

    3. 单击创建

  6. 构建和部署模型教程需要以下其他服务:

    • watsonx.ai工作室
    • watsonx.ai运行时
    • IBM Knowledge Catalog
    • Cloud Object Storage

检查点图标检查您的进度

下图显示了供应的服务实例。 现在,您已准备好开始本教程。

提供的服务




任务 1: 运行 Notebook 以设置监视器

预览教程视频 To preview this task, watch the video beginning at 01:55.


运行样本项目中包含的第二个 Notebook 以:

  • 访存模型和部署。
  • 配置 Watson OpenScale。
  • 为机器学习服务创建服务提供者和预订。
  • 配置质量监视器。
  • 配置公平性监视器。
  • 配置可解释性。

执行以下步骤以运行样本项目中包含的 Notebook。 此笔记本为您的模型设置监视器,也可以通过用户界面进行配置。 但是,使用 Notebook 对它们进行设置会更快,更不容易发生错误。 花一些时间阅读 Notebook 中的注释,这些注释说明了每个单元格中的代码。

  1. 导航菜单"导航菜单,选择项目 > 查看所有项目

  2. 打开 AI Governance 项目。

    注: 您可能会看到一个指导式教程,其中显示了此用例随附的教程。 导览中的链接将打开这些教程指示信息。
  3. 单击 "资产"选项卡,然后导航至笔记本
    左侧导航

  4. 打开 2-monitor-wml-model-with-watson-openscale 笔记本。

  5. 由于笔记本处于只读模式,单击 "编辑 编辑图标将笔记本置于编辑模式。

  6. 从资源中心导入项目时,此 Notebook 的第一个单元包含项目访问令牌。 如果此笔记本不包含具有项目访问令牌的第一个单元,那么要生成令牌,请从 更多 菜单中选择 插入项目令牌。 此操作将新单元作为包含项目令牌的 Notebook 中的第一个单元插入。

  7. 插入 IBM Cloud API 密钥 部分下,将 API 密钥粘贴到 ibmcloud_api_key 字段中。

  8. 单击 单元> 全部运行 以运行 Notebook 中的所有单元。 或者,如果要浏览每个单元及其输出,那么可以按单元运行 Notebook 单元。

  9. 笔记本需要 1-3 分钟才能完成。 您可以通过将星号 "In [*]" 更改为数字 (例如, "In [1]") 的单元格来监视进度单元格。

  10. 如果在 Notebook 运行期间迂到任何错误,请尝试以下故障诊断提示:

    • 单击 内核> 重新启动并清除输出 以重新启动内核,然后再次运行 Notebook。

    • 删除任何现有 Watson OpenScale 部署,并 供应 新的服务实例。

    • 验证您是否在 "构建和部署模型 "教程中创建了 AI 用例、部署空间和部署名称,方法是准确复制并粘贴指定的工件名称,且不留前导空格或尾部空格。

检查点图标检查您的进度

下图显示了运行完成时的 Notebook。 笔记本为您的模型设置了监视器,因此您现在可以在 Watson OpenScale中查看部署。

已完成 Notebook 运行




任务 2: 评估模型

预览教程视频 To preview this task, watch the video beginning at 03:40.

执行以下步骤以下载保留数据,并使用该数据在 Watson OpenScale中评估模型:

  1. 单击导航路径中的人工智能治理项目。
    导航跟踪

  2. 资产 选项卡上,单击 数据> 数据资产

  3. 点击 "溢出菜单中的 "溢出菜单,选择 "GoldenBank_HoldoutData.csv数据资产的 "下载。 要验证模型是否按需要工作,您需要一组从模型训练中保留下来的带标签数据。 此 CSV 文件包含该保留数据。

  4. 启动 Watson OpenScale。 从导航菜单"导航菜单,选择服务 > 服务实例

  5. 打开 Watson OpenScale 实例。 如果出现提示,请使用用于注册 Cloud Pak for Data的相同凭证登录。

  6. 在 Watson OpenScale 服务实例页面上,单击 启动 Watson OpenScale

  7. "洞察" 仪表板上,单击 抵押贷款审批模型部署 磁贴。

  8. 操作 菜单中,选择 立即评估

  9. 从导入选项列表中,选择 从 CSV 文件

  10. 拖动金的Bank_HoldoutData.csv将您从项目下载的数据文件放入侧面板。

  11. 单击 上载并评估

检查点图标检查您的进度

下图显示了 Watson OpenScale中已部署模型的评估结果。 现在,您已评估模型,准备好观察模型质量。

已评估的模型




任务 3: 观察模型监视器的质量

预览教程视频 To preview this task, watch the video beginning at 04:44.

Watson OpenScale 质量监视器会生成一组度量值,以评估模型的质量。 您可以使用这些质量指标来确定模型预测结果的良好程度。 当使用保留数据的评估完成时,请遵循以下步骤来观察模型质量或准确性:

  1. 在左侧导航面板中,点击Insights 仪表板图标 "洞察仪表板

  2. 找到 抵押贷款审批模型部署 磁贴。 请注意,部署存在 0 个问题,并且已通过 质量公平性 测试,这意味着模型满足所需的阈值。

  3. 单击 抵押贷款审批模型部署 磁贴以查看更多详细信息。

  4. 质量部分,点击配置图标 "配置。 在这里,您可以看到为此监视器配置的质量阈值为 70% ,并且所使用的质量测量是 ROC 曲线下的面积。

  5. 单击 转至模型摘要 以返回到模型详细信息屏幕。

  6. 质量部分,单击详细信息图标详细信息,查看模型质量的详细结果。 在这里,您可以看到一些质量度量计算和一个混淆矩阵,其中显示了正确的模型决策以及误报和误报。 ROC 曲线下的计算面积为 0.9 或更高,这超过了 0.7 阈值,因此模型满足其质量要求。

  7. 单击导航跟踪中的 抵押核准模型部署 以返回到模型详细信息屏幕。

检查点图标检查您的进度

下图显示了 Watson OpenScale中的质量详细信息。 现在,您已观察到模型质量,可以观察到模型公平性。

质量




任务 4: 观察模型监视器以获取公平性

预览教程视频 To preview this task, watch the video beginning at 06:01.

Watson OpenScale 公平性监视器生成一组度量以评估模型的公平性。 您可以使用公平性指标来确定模型是否产生有偏差的结果。 遵循以下步骤来观察模型公平性:

  1. 公平性部分,点击配置图标 "配置。 在这里,您可以看到正在对该模型进行复审,以确保对申请人进行公平对待,而无论其性别如何。 妇女被确定为受监测群体,正在对其进行公平性衡量,公平性的门槛至少为 80%。 公平性监视器使用不同的影响方法来确定公平性。 不同影响将受监视组的有利结果百分比与参考组的有利结果百分比进行比较。

  2. 单击 转至模型摘要 以返回到模型详细信息屏幕。

  3. 公平性部分,单击详细信息图标 "详细信息,查看模型公平性的详细结果。 在这里,您可以看到正在自动批准的男性和女性申请人的百分比,以及超过 100% 的公平性分数,因此模型性能远远超过所需的 80% 公平性阈值。

  4. 请注意标识的数据集。 为了确保公平性指标最准确, Watson OpenScale 使用扰动来确定仅更改受保护属性和相关模型输入而其他功能保持不变的结果。 扰动将特征的值从参考组更改为受监视组,反之亦然。 当使用 "均衡" 数据集时,这些附加护栏用于计算公平性,但您也可以仅使用有效内容或模型训练数据来查看公平性结果。 由于模型的行为是公平的,因此您无需为此度量输入其他详细信息。

    公平性数据集

  5. 单击 抵押核准模型部署 导航跟踪以返回到模型详细信息屏幕。

检查点图标检查您的进度

下图显示了 Watson OpenScale中的公平性详细信息。 现在,您已观察到模型公平性,可以观察到模型可解释性。

公平性




任务 5: 观察模型监视器以了解可解释性

预览教程视频 To preview this task, watch the video beginning at 07:42.

了解模型是如何做出决定的也很重要。 需要这种理解来向参与贷款审批的人员解释决策,并确保模型所有者的决策有效。 要了解这些决策,请执行以下步骤来观察模型可解释性:

  1. 在左侧导航面板中,单击 "解释交易"图标 "解释事务

  2. 选择 抵押核准模型部署 以查看交易列表。

  3. 对于任何事务,单击 操作 列下的 说明 。 在这里,您将看到此决策的详细说明。 您将看到模型的最重要输入以及每个输入对最终结果的重要性。 蓝色条形表示倾向于支持模型决策的输入,而红色条形显示可能导致另一个决策的输入。 例如,申请人可能有足够的收入可以通过其他方式获得批准,但他们的不良信用历史记录和高额债务共同导致模型拒绝申请。 查看此说明以了解模型决策的基础。

  4. (可选) 如果要进一步深入了解模型如何作出其决策,请单击 检查 选项卡。 使用 检查 功能来分析决策以查找敏感度区域,在这些区域中,对几个输入的少量更改将导致不同的决策,并且您可以通过使用替代方法覆盖某些实际输入来自行测试敏感度,以查看这些更改是否会影响结果。

检查点图标检查您的进度

下图显示了 Watson OpenScale中事务的可解释性。 您已确定该模型是准确的,并且公平对待所有申请人。 现在,您可以将模型推进到其生命周期中的下一个阶段。

可解释性




任务 6: 将模型提升为预生产并核准模型

预览教程视频 To preview this task, watch the video beginning at 09:21.

执行以下步骤以更改模型库存中 AI 用例的状态并核准模型:

  1. 返回Cloud Pak for Data,从导航菜单"导航菜单中选择目录 > 人工智能用例

  2. 打开 抵押贷款审批模型用例

  3. 单击 生命周期 选项卡以查看模型现在处于 验证 阶段。

  4. 单击状态旁边的编辑图标 "编辑,选择验证完成,然后单击更新

  5. 返回到 Watson OpenScale "洞察" 仪表板

  6. 单击 抵押贷款审批模型部署 磁贴。

  7. 操作 菜单中,选择 批准生产,然后单击 批准。 此操作传达给 AI 操作团队,他们现在可以将模型部署到指定的生产空间。

  8. 导航菜单"导航菜单,选择目录 > 人工智能用例

  9. 对于 " 抵押贷款核准模型用例" ,单击 查看详细信息

  10. 单击 生命周期 选项卡。 在 模型跟踪下, AI 用例现在显示为在 验证 阶段中评估并核准。

  11. 查看 抵押贷款审批模型部署 ,以查看 Watson OpenScale捕获的 Factsheet。

  12. 关闭模型部署构面。

检查点图标检查您的进度

下图显示了 AI 用例以及 "验证" 阶段中的模型。 您的模型现在处于生产状态。

"验证" 阶段中的 AI 用例

共享模型

预览教程视频 To preview this task, watch the video beginning at 10:39.

您可以从 PDF , HTML 和 DOCX 格式的 factsheet 或 AI 用例生成报告,以便可以共享或打印有关所跟踪模型的详细信息。

注:

如果您没有 Platform assets catalog,请参阅 创建 Platform assets catalog

  1. 从 AI 用例中的 资产 选项卡,单击 导出报告

  2. 对于 格式选项,选择格式。

  3. 对于 报告模板,选择模板:

    • 完整报告: 包含 "基本" 报告中的所有数据以及有关 AI 用例中的模型和部署的详细信息。

    • 基本报告: 包含 "概述" 和 "资产" 选项卡上可见的事实集。

  4. 单击导出。 报告将显示在新窗口中。 如果报告未显示,请访问浏览器的下载,并从其中查看 PDF 文件。

检查点图标检查您的进度

下图显示了 抵押贷款审批模型用例的完整报告。 现在,您可以与同事共享此报告。

AI 用例报告



作为 Golden Bank 的数据科学家,您创建了一个抵押贷款审批模型,可避免意外风险,并公平对待所有申请人。 您运行了Jupyter笔记本,为机器学习模型设置了监控器,并将其部署到生产中使用,确信该模型能按照预期有效运行。


清除(可选)

如果要重新学习 AI 监管用例中的教程,请删除以下工件。

工件 如何删除
金银预生产空间中的抵押贷款审批模型部署 删除部署
金银预生产空间 删除部署空间
抵押贷款核准模型用例 删除模型用例
抵押贷款审批目录 删除目录
AI 治理样本项目 删除项目

后续步骤

了解更多信息

观看视频观看如何使用IBM OpenPages管理模型的生命周期操作。

此视频提供了一种可视方法来学习本文档中的概念和任务。

父主题: 用例教程

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more