您可使用以下方法来解决 IBM Watson OpenScale 的问题。
- 我在使用 AutoAI 时,为什么会收到有关数据不匹配的错误?
- 为什么我会在模型配置期间收到错误?
- 为什么在我使用 XGBoost 时缺少类标签?
- 为什么有效内容分析未正确显示?
- 错误:计算特征重要性时发生错误
- 为什么我的一些活动除偏记录缺失?
- Watson OpenScale 不显示任何可用模式
- 监视器运行失败,显示
OutOfResources exception
错误消息
我在使用 AutoAI 时,为什么会收到有关数据不匹配的错误?
您在使用 AutoAI 进行二元分类时,收到有关数据不匹配的错误消息。 请注意,AutoAI 仅在 IBM Watson OpenScale for IBM Cloud Pak for Data 中受支持。
对于二元分类,AutoAI 自动将预测列的数据类型设置为 boolean。
要解决此问题,请实现以下某个解决方案:
- 将训练数据中的标签列值更改为整数值,如
0
或1
,具体取决于结果。 - 将训练数据中的标签列值更改为字符串值,如
A
和B
。
为什么我会在模型配置期间收到错误?
配置模型详细信息时,显示了以下错误消息:字段 feature_fields
引用了列 <name>
,该列在模型的 input_schema
中缺失。 特征在输入模式中找不到。
在配置期间完成模型详细信息部分时出现的上述消息指示模型输入模式和模型训练数据模式之间不匹配:
要修复该问题,您必须确定是以下哪种情况导致了错误,并采取纠正措施:如果您使用IBM watsonx.aiRuntime 作为机器学习提供程序,且模型类型为 XGBoost/scikit-learn,请参阅watsonx.aiRuntimePythonSDK 文档,了解有关如何存储模型的重要信息。 要生成漂移检测模型,必须在 Notebook 中使用 scikit-learn V0.20.2。 对于其他所有情况,必须确保训练数据列名与输入模式列名匹配。
为什么在我使用 XGBoost 时缺少类标签?
本机 XGBoost 多类分类不返回类标签。
缺省情况下,对于二元和多类模型,XGBoost 框架不返回类标签。
对于 XGBoost 二元和多类模型,必须将模型更新为返回类标签。
为什么有效内容分析未正确显示?
有效内容分析未正确显示,并且会在列名中显示以下错误消息: AIQDT0044E For紫禁字符 "
<column name>
为了正确处理有效内容分析, Watson OpenScale 不支持使用双引号 (") 的列名 在有效内容中。 这同时影响 CSV 和 JSON 格式的评分有效内容和回馈数据。
从有效内容文件的列名中移除双引号 (")。
错误:计算特征重要性时发生错误
您在处理期间收到以下错误消息:Error: An error occurred while computing feature importance
。
在数据集的列名中包含等号 (=) 会导致可解释性问题。
请从列名移除等号 (=) 并再次将数据集发送到处理过程。
为什么我的一些活动除偏记录缺失?
活动除偏记录不会进入有效内容日志记录表。
使用活动除偏 API 时,针对有效内容日志记录,一次可以发送的记录数限制为 1000。
要避免丢失数据,必须使用活动除偏 API 对不超过 1000 个记录的区块评分。
Watson OpenScale 不显示任何可用模式
用户尝试检索 Watson OpenScale 的模式信息时,没有任何内容可用。 直接在 Db2 中进行尝试(不引用 Watson OpenScale)之后,检查该数据库用户标识有哪些模式可用也没有返回任何内容。
数据库用户标识的许可权不足导致 Watson OpenScale 的数据库连接问题。
确保数据库用户有 Watson OpenScale 所需的正确许可权。
监视器运行失败,并返回 OutOfResources exception
错误消息
您收到 OutOfResources exception
错误消息。
虽然您可以在反馈有效内容,评分有效内容或业务有效内容表中拥有的行数不再有限制。 但对可以在每个结算周期的质量和偏差监视器中运行的记录数有 50,000 条限制。
达到限制后,必须升级到标准套餐或等待下一个结算周期。
缺少部署
某个已部署模型未显示为可以选择以创建预订的部署。
部署未在可用已部署模型列表中显示的原因有多种。 如果该模型由于使用了不受支持的算法或框架而导致不是受支持的模型类型,则不会出现。 机器学习提供程序可能未正确配置。 也可能是许可权存在问题。
使用以下步骤来解决此问题:
- 检查模型是否为受支持的类型。
- 检查特定部署空间的 Watson OpenScale 配置中是否存在机器学习提供程序。
- 检查 CP4D
admin
用户是否有权访问该部署空间。
Watson OpenScale 评估可能由于大量预订而失败
如果 Watson OpenScale 实例包含过多预订 (例如 100 个预订) ,那么质量评估可能会失败。 您可以在日志中查看显示以下错误消息的数据集市服务 pod 的故障详细信息:
"Failure converting response to expected model EntityStreamSizeException: actual entity size (Some(8644836)) exceeded content length limit (8388608 bytes)! You can configure this by setting akka.http.[server|client].parsing.max-content-length or calling HttpEntity.withSizeLimit before materializing the dataBytes stream".
您可以使用 oc get pod -l component=aios-datamart
命令来查找 pod 的名称。 您还可以将 oc logs <pod name>
命令用于 pod 的日志。
要修正此错误,可以使用以下命令通过编辑 "ADDITIONAL_JVM_OPTIONS"
环境变量来增加最大请求主体大小:
oc patch woservice <release name> -p '{"spec": {"datamart": {"additional_jvm_options":"-Dakka.http.client.parsing.max-content-length=100m"} }}' --type=merge
如果在安装 Watson OpenScale时未定制发行版名称,那么发行版名称为 "aiopenscale"
。
Microsoft Azure ML Studio
在两种类型的 Azure Machine Learning Web 服务中,只有
New
类型受 Watson OpenScale 支持。Classic
类型不受支持。必须使用缺省输入名称: 在 Azure Web Service 中,缺省输入名称为
"input1"
。 当前,此字段是针对 Watson OpenScale 强制要求的,如果缺少此字段,Watson OpenScale 将无法正常运作。如果 Azure Web Service 未使用缺省名称,请将输入字段名称更改为
"input1"
,然后重新部署 Web Service 并重新配置 OpenScale 机器学习提供程序设置。如果调用 Microsoft Azure ML Studio 以列出机器学习模型时导致响应超时(例如在有许多 Web 服务时),必须增加超时值。 可能需要通过更改
/etc/haproxy/haproxy.cfg
配置设置来解决此问题:登录到负载均衡器节点并更新
/etc/haproxy/haproxy.cfg
,以将客户机和服务器超时从1m
设置为5m
:timeout client 5m timeout server 5m
运行
systemctl restart haproxy
以重新启动 HAProxy 负载均衡器。
如果您使用不同于 HAProxy 的负载均衡器,可能需要以类似的方式调整超时值。
- 在两种类型的 Azure Machine Learning Web 服务中,只有
New
类型受 Watson OpenScale 支持。Classic
类型不受支持。
导入设置后,在生产预订中上载回馈数据失败
将预生产空间中的设置导入到生产空间后,上载回馈数据时可能会出现问题。 数据类型不严格匹配时,会发生此情况。 导入设置时,反馈表将引用其列类型的有效内容表。 通过首先确保有效内容数据有最精确的值类型,可以避免此问题。 例如,必须使双精度数据类型优先于整数数据类型。
Microsoft Azure Machine Learning Service
执行模型评估时,当 Watson OpenScale 需要调用部署评分端点时,可能会迂到无法与 Azure Machine Learning 服务进行通信的问题。 强制实施企业安全策略的安全性工具(如 Symantec Blue Coat)可能会阻止此类访问。
Watson OpenScale 无法为批处理部署预订创建新的 Hive 表
在 Watson OpenScale 批处理部署配置期间选择使用 Parquet
格式创建新的 Apache Hive 表时,可能会发生以下错误:
Attribute name "table name" contains invalid character(s) among " ,;{}()\\n\\t=". Please use alias to rename it.;
如果 Watson OpenScale 由于列名中的空格而无法运行 CREATE TABLE
SQL 操作,那么会发生此错误。 为了避免此错误,您可以从列名中除去任何空格,或者将 Apache Hive 格式更改为 csv
。
Watson OpenScale 设置可能失败,带有缺省 Db2 数据库
设置 Watson OpenScale 并指定缺省 Db2 数据库时,安装可能无法完成。
要解决此问题,必须在 Cloud Pak for Data 中运行以下命令以更新 Db2:
db2 update db cfg using DFT_EXTENT_SZ 32
运行该命令后,必须创建新的 Db2 数据库以设置 Watson OpenScale。
父主题: 故障诊断