在评估机器学习模型时,您可以使用IBM watsonx.aiRuntime 执行有效载荷日志、反馈日志,并测量性能准确性、运行时偏差检测、漂移检测、可解释性和自动纠偏功能。
评估机器学习模型支持以下IBM watsonx.aiRuntime 框架:
表 1. 框架支持详细信息
框架 | 问题类型 | 数据类型 |
---|---|---|
AutoAI1 | 分类(二元和多类) | 结构化(数据、文本) |
AutoAI | 回归 | 结构化或非结构化2(仅文本) |
Apache Spark MLlib | 分类 | 结构化或非结构化2(仅文本) |
Apache Spark MLLib | 回归 | 结构化或非结构化2(仅文本) |
Keras 带有 TensorFlow3&4 | 分类 | 非结构化2(图像、文本) |
Keras 带有 TensorFlow3&4 | 回归 | 非结构化2(图像、文本) |
Python 函数 | 分类 | 结构化(数据、文本) |
Python 函数 | 回归 | 结构化(数据、文本) |
scikit-learn5 | 分类 | 结构化(数据、文本) |
scikit-learn | 回归 | 结构化(数据、文本) |
XGBoost6 | 分类 | 结构化(数据、文本) |
XGBoost | 回归 | 结构化(数据、文本) |
1要了解有关 AutoAI 的更多信息,请参阅 AutoAI 实现详细信息。 对于在 Cloud Object Storage 中具有训练数据的模型,不支持布尔类型的公平性属性。 但是,如果训练数据在Db2 中,模型评估则支持布尔类型的公平属性。 使用AutoAI选项时,如果模型预测是二进制数据类型,则不支持模型评估。 您必须更改此类模型,以便其预测的数据类型为字符串数据类型。
2对于非结构化(图像或文本)数据类型,不支持公平性和漂移指标。
3Keras 支持不包含对公平性的支持。
4如果您的模型/框架会输出预测概率,那么支持可解释性。
5要生成漂移检测模型,必须在 Notebook 中使用 scikit-learn V 1.3.2 。
6对于 XGBoost 二进制和多个类模型,必须更新模型以返回二进制模型的数值形式的预测概率,以及多类模型的每个类的概率列表。 Support for the XGBoost framework has the following limitations for classification problems: For binary classification, the binary:logistic
logistic regression function with an output as a probability of True
is supported for model evaluations. 对于多类分类,支持使用 "multi:softprob
函数进行模型评估,其结果包含每个数据点属于每一类的预测概率。
AutoAI 模型和训练数据
AutoAI 自动准备数据,应用算法或估计量,并构建最适合您的数据和用例的模型管道。 要对模型进行评估分析,就必须获取训练数据。
由于AutoAI模型评估无法像普通模型那样检测到训练数据位置,因此必须明确提供访问训练数据位置所需的详细信息:
- 对于在其中手动配置监视器的联机路径,必须提供可从中访问训练数据的数据库详细信息。
- 对于您在其中上载训练数据分布的定制 Notebook 路径,可以使用通过运行 Notebook 所生成的 JSON 文件。
有关更多信息,请参阅提供模型详细信息。
指定IBM watsonx.aiRuntime 服务实例
配置模型评估的第一步是指定一个IBM watsonx.aiRuntime 实例。 您的watsonx.aiRuntime 实例是您存储人工智能模型和部署的地方。
先决条件
您应该在模型评估服务实例所在的同一帐户或群集中配置了IBM watsonx.aiRuntime 实例。 如果您在其他帐户或群集中配置了IBM watsonx.aiRuntime 实例,则无法为该实例配置模型评估的自动有效负载日志。
连接watsonx.aiRuntime 服务实例
您可以连接到IBM watsonx.aiRuntime 实例中的人工智能模型和部署,以进行模型评估。 要连接服务,请转到配置"选项卡,添加机器学习提供程序,然后点击编辑"图标。 除了名称和描述以及这是预生产还是生产环境类型之外,还必须提供特定于此服务实例类型的以下信息:
- 如果有IBM watsonx.aiRuntime 实例,则会检测到该实例以及配置信息。
上级主题: 受支持的机器学习引擎,框架和模型