0 / 0
Go back to the English version of the documentation
对 Watson Machine Learning 进行故障诊断
Last updated: 2024年9月30日
对 Watson Machine Learning 进行故障诊断

以下是有关使用 IBM Watson Machine Learning的常见故障诊断问题的答案。

获取 Watson Machine Learning 的帮助和支持

如果您在使用 Watson Machine Learning时迂到问题或有疑问,那么可以通过搜索信息或通过论坛提问来获取帮助。 您也可以开具支持凭单。

使用论坛提问时,请标记您的问题,以便 Watson Machine Learning 开发团队可以看到该问题。

如果您有有关 Watson Machine Learning的技术问题,请将您的问题发布到 Stack Overflow 外部链接图标 上,并使用 ibm-bluemixmachine-learning标记您的问题。

有关服务和入门指示信息的问题,请使用 IBM developerWorks dW Answers 外部链接图标 论坛。 必须包含 machine-learningbluemix 标记。

内容

请按照以下提示解决您在使用 Watson Machine Learning时可能遇到的常见问题。

训练AutoAI实验时,服务 ID 凭据失败

如果使用 serviceID, 的 API 密钥训练 AutoAI 实验,可能会出现此错误:

User specified in query parameters does not match user from token.

解决这个问题的方法之一是使用用户凭据运行实验。 如果要使用服务凭据运行实验,请按照以下步骤更新服务 ID 的角色和策略。

  1. 打开 serviceID on IBM Cloud

    查找 serviceID 策略页面

  2. 创建新的 serviceID 或使用以下访问策略更新现有 ID:

    • 所有 IAM 账户管理服务,包括 API 密钥审核员、用户 API 密钥创建者、查看器、操作员和编辑器。 理想情况下,他们最好为此 ServiceId 创建一个新的 apikey。更新 serviceID 的策略和角色
  3. 更新后的政策如下:更新了 serviceID 策略

  4. 使用更新后的 serviceID 的证书再次运行培训。

在部署空间中为 SPSS Modeler 流程创建作业失败

在为部署空间中的 SPSS Modeler 流程配置批处理作业的过程中,数据资产与其各自连接的自动映射可能会失败。

图片显示,数据资产和连接的自动映射失败

要修复数据资产和连接的自动映射错误,请按照以下步骤操作:

  1. 单击创建并保存保存进度,并退出新建作业配置对话框。

  2. 在部署空间中,单击 Jobs 选项卡并选择 SPSS Modeler 流程作业,查看作业的详细信息。

  3. 在任务详细信息页面,单击 Edit 图标 编辑图标图像 手动更新数据资产和连接的映射。

  4. 更新数据资产和连接的映射后,您可以继续在 新任务对话框中配置任务设置。 有关更多信息,请参阅 为 SPSS Modeler 流量创建部署作业

    图片显示数据资产和连接的自动映射已成功完成

不活动的 Watson Machine Learning 实例

症状

尝试通过单击 "提示实验室" 中的 生成 按钮向基础模型提交推论请求后,将显示以下错误消息:

'code': 'no_associated_service_instance_error',
'message': 'WML instance {instance_id} status is not active, current status: Inactive'

可能的原因

watsonx.ai 项目与相关 Watson Machine Learning 服务实例之间的关联已丢失。

可能的解决方案

重新创建或刷新 watsonx.ai 项目与相关 Watson Machine Learning 服务实例之间的关联。 要完成此操作,请执行以下步骤:

  1. 从主菜单中,展开 项目,然后单击 查看所有项目
  2. 单击 watsonx.ai 项目。
  3. 管理 选项卡中,单击 服务和集成
  4. 如果列出了相应的 Watson Machine Learning 服务实例,请通过选择该实例,然后单击 除去来暂时解除其关联。 确认除去。
  5. 单击 关联服务
  6. 从列表中选择相应的 Watson Machine Learning 服务实例,然后单击 关联

未提供授权令牌。

问题描述

无法成功调用 REST API。

问题原因

Authorization 头中未提供授权令牌。

解决方法

Authorization 头中传递授权令牌。

授权令牌无效。

问题描述

无法成功调用 REST API。

问题原因

无法对提供的授权令牌进行解码或解析。

解决方法

Authorization 头中传递正确的授权令牌。

请求中使用的授权令牌和 instance_id 不相同。

问题描述

无法成功调用 REST API。

问题原因

不会为使用所针对的服务实例生成所使用的授权令牌。

解决方法

Authorization 头中传递与正在使用的服务实例相对应的授权令牌。

授权令牌已到期。

问题描述

无法成功调用 REST API。

问题原因

授权令牌已到期。

解决方法

Authorization 头中传递未到期的授权令牌。

认证所需的公用密钥不可用。

问题描述

无法成功调用 REST API。

问题原因

由于内部服务问题,可能会发生此问题。

解决方法

请与支持团队联系。

在 {{timeout}} 之后超时的操作

问题描述

无法成功调用 REST API。

问题原因

执行所请求的操作时发生超时。

解决方法

请再次尝试调用该操作。

类型为 {{type}} 的未处理的异常:{{status}}

问题描述

无法成功调用 REST API。

问题原因

由于内部服务问题,可能会发生此问题。

解决方法

请再次尝试调用该操作。 如果再次发生,请与支持团队联系。

类型为 {{type}} 的未处理的异常:{{response}}

问题描述

无法成功调用 REST API。

问题原因

由于内部服务问题,可能会发生此问题。

解决方法

请再次尝试调用该操作。 如果再次发生,请与支持团队联系。

类型为 {{type}} 的未处理的异常:{{json}}

问题描述

无法成功调用 REST API。

问题原因

由于内部服务问题,可能会发生此问题。

解决方法

请再次尝试调用该操作。 如果再次发生,请与支持团队联系。

类型为 {{type}} 的未处理的异常:{{message}}

问题描述

无法成功调用 REST API。

问题原因

由于内部服务问题,可能会发生此问题。

解决方法

请再次尝试调用该操作。 如果再次发生,请与支持团队联系。

找不到请求的对象。

问题描述

无法成功调用 REST API。

问题原因

找不到请求资源。

解决方法

确保您引用的是现有资源。

底层数据库报告了太多请求。

问题描述

无法成功调用 REST API。

问题原因

用户在特定时间内发送了太多请求。

解决方法

请再次尝试调用该操作。

artifactModelVersion 或部署中没有定义评估的定义。 必须指定 " + \n " 至少在其中一个位置。

问题描述

无法成功调用 REST API。

问题原因

"学习配置" 未包含所有必需信息

解决方法

learning configuration 中提供 definition

评估需要为模型指定的学习配置。

问题描述

无法创建 learning iteration

问题原因

没有为模型定义 learning configuration

解决方法

请创建 learning configuration ,然后再次尝试创建 learning iteration

评估要求在 X-Spark-Service-Instance 头中提供 spark 实例

问题描述

无法成功调用 REST API。

问题原因

learning configuration 没有必需的信息。

解决方法

在 "学习配置" 或 X-Spark-Service-Instance 头中提供 spark_service

模型不包含任何版本。

问题描述

无法创建部署或设置 learning configuration

问题原因

由于与模型持久性相关的不一致,可能会发生此问题。

解决方法

请再次尝试持久存储该模型,然后再次尝试执行该操作。

在 IBM Federated Learning 中找不到数据模块。

问题描述

IBM Federated Learning 的数据处理程序正在尝试从 FL 库中抽取数据模块,但找不到该模块。 您可能会看到以下错误消息:

ModuleNotFoundError: No module named 'ibmfl.util.datasets'

问题原因

可能是过时的 DataHandler。

解决方法

查看并更新 DataHandler 以符合最新的 MNIST 数据处理程序 ,或者确保样本版本是最新的。

补丁操作只能修改现有学习配置。

问题描述

无法调用补丁 REST API 方法来修补学习配置。

问题原因

没有为此模型设置 learning configuration ,或者该模型不存在。

解决方法

确保模型存在并且已设置学习配置。

补丁操作期望恰好是一个替换操作。

问题描述

无法修补部署。

问题原因

补丁有效内容包含多个操作,或者补丁操作与 replace不同。

解决方法

在补丁有效内容中仅使用一个操作,即 replace 操作。

有效内容缺少必填字段 :FIELD 或字段值已损坏。

问题描述

无法处理与访问底层数据集相关的操作。

问题原因

未正确定义数据集的访问权。

解决方法

请更正数据集的访问定义。

不支持提供的评估方法:METHOD。 支持的值为:VALUE。

问题描述

无法创建学习配置。

问题原因

使用了错误的评估方法来创建学习配置。

解决方法

使用受支持的求值方法,即 regressionbinarymulticlass之一。

每个模型只能有一个活动评估。 无法完成请求,因为现有活动评估: {{url}}

问题描述

无法创建另一个学习迭代。

问题原因

只能有一个正在运行的模型评估。

解决方法

请参阅已在运行的评估,或者等待评估结束并启动新的评估。

不支持部署类型 {{type}}。

问题描述

无法创建部署。

问题原因

未使用支持的部署类型。

解决方法

必须使用受支持的部署类型。

输入不正确:({{message}})

问题描述

无法成功调用 REST API。

问题原因

由于解析 JSON 时发生问题,因此发生此问题。

解决方法

请确保在请求中传递正确的 JSON。

数据不足-无法计算度量 {{name}}

问题描述

学习迭代失败。

问题原因

由于反馈数据不足,无法计算具有已定义阈值的度量值。

解决方法

learning configuration 中查看和改进数据源 feedback_data_ref 中的数据

对于类型 {{type}},必须在 X-Spark-Service-Instance 头中提供 spark 实例

问题描述

无法创建部署

问题原因

batchstreaming 部署需要提供 spark 实例

解决方法

请在 X-Spark-Service-Instance 头中提供 spark 实例

操作 {{action}} 失败,消息为 {{message}}

问题描述

无法成功调用 REST API。

问题原因

由于调用底层服务时发生问题,因此发生此问题。

解决方法

如果消息提供了解决问题的建议,请遵循该建议。 否则,请联系支持团队。

不允许路径 {{path}}。 补丁流唯一允许的路径是 /status

问题描述

无法修补流部署。

问题原因

用于修补 stream 部署的路径不正确。

解决方法

使用受支持的路径选项 /status (允许启动/停止流处理) 对 stream 部署进行修补。

例如,不允许类型为 {{$type}} 的补丁操作

问题描述

无法修补部署。

问题原因

正在修补错误的部署类型。

解决方法

请修补 stream 部署类型。

数据连接 {{data}} 对于 feedback_data_ref 无效

问题描述

无法为模型创建 learning configuration

问题原因

定义 feedback_data_ref 时,未使用受支持的数据源。

解决方法

仅使用受支持的数据源类型 dashdb

不允许路径 {{path}}。 补丁模型唯一允许的路径是 /deployed_version/url/deployed_version/href (对于 V2 )

问题描述

没有用于修补模型的选项。

问题原因

在修补模型期间使用了错误的路径。

解决方法

具有受支持路径的补丁模型,可用于更新已部署模型的版本。

解析失败:{{msg}}

问题描述

无法成功调用 REST API。

问题原因

无法成功解析请求的有效内容。

解决方法

请确保您的请求有效内容正确并且可以正确解析。

learning configuration不支持所选模型 {{env}} 的运行时环境。 支持的环境:[{{supported_envs}}]。

问题描述

没有用于创建 learning configuration的选项。

问题原因

不支持尝试针对其创建 learning_configuration 的模型。

解决方法

为模型创建 learning configuration ,该模型具有受支持的运行时。

当前计划 "{{plan}}" 仅允许 {{limit}} 个部署

问题描述

无法创建部署。

问题原因

已达到当前套餐的部署数限制。

解决方法

升级到没有此类限制的套餐。

数据库连接定义无效 ({{code}})

问题描述

无法使用 learning configuration 函数。

问题原因

数据库连接定义无效。

解决方法

请尝试解决底层数据库返回的 code 所描述的问题。

连接底层 {{system}} 时发生问题

问题描述

无法成功调用 REST API。

问题原因

由于在连接到底层系统期间发生问题,可能会发生此问题。 这可能是临时网络问题。

解决方法

请再次尝试调用该操作。 如果再次发生错误,请与支持团队联系。

抽取 X-Spark-Service-Instance 头时出错:({{message}})

问题描述

如果无法调用需要 Spark 凭证的 REST API ,那么可能会发生此问题。

问题原因

由于 base-64 解码或解析 Spark 凭证时发生问题,可能会发生此问题。

解决方法

确保正确的 Spark 凭证已正确 base-64 编码。 有关更多信息,请参阅说明文档。

此功能对于非 Beta 用户是禁止的。

问题描述

无法成功调用 REST API。

问题原因

调用的 REST API 在 Beta 中。

解决方法

如果您感兴趣参与,请将自己添加到等待列表。 可在文档中找到详细信息。

{{code}} {{message}}

问题描述

无法成功调用 REST API。

问题原因

由于调用底层服务时发生问题,可能会发生此问题。

解决方法

如果消息提供了解决问题的建议,请遵循该建议。 否则,请联系支持团队。

超出速度限制。

问题描述

超出速度限制。

问题原因

已超过当前计划的速率限制。

解决方法

要解决此问题,请获取速度上限更高的其他套餐

查询参数 {{paramName}} 无效,值:{{value}}

问题描述

因为针对查询参数传递了不正确的值,发生验证错误。

问题原因

获取查询的结果时出错。

解决方法

请纠正查询参数值。 可在文档中找到详细信息。

令牌类型无效:{{type}}

问题描述

有关令牌类型的错误。

问题原因

授权出错。

解决方法

令牌必须以 Bearer 前缀开头。

令牌格式无效。 必须使用不记名令牌格式。

问题描述

有关令牌格式的错误。

问题原因

授权出错。

解决方法

令牌必须是不记名令牌,并且必须以 Bearer 前缀开头。

输入 JSON 文件缺失或无效:400

问题描述

尝试联机评分时显示以下消息:输入 JSON 文件缺失或无效

问题原因

评分输入有效内容与对模型评分所需的预期输入类型不匹配时,会显示此消息。 具体来说,以下原因可能适用:

  • 输入有效内容为空。
  • 输入有效内容模式无效。
  • 输入数据类型与期望的数据类型不匹配。

解决方法

请纠正输入有效内容。 确保有效内容具有正确的语法、有效的模式和适当的数据类型。 进行更正后,重试联机评分。 对于语法问题,请使用 jsonlint 命令验证 JSON 文件。

授权令牌已到期: 401

问题描述

尝试联机评分时显示以下消息:授权失败

问题原因

当用于评分的令牌到期时,将显示此消息。

解决方法

重新生成此 IBM Watson Machine Learning 实例的令牌,然后重试。 如果仍然看到此问题,请与 IBM 支持人员联系。

未知部署标识: 404

问题描述

尝试联机评分时显示以下消息:未知部署标识

问题原因

当用于评分的部署标识不存在时,将显示此消息。

解决方法

确保提供正确的部署标识。 如果不是,请使用部署标识来部署模型,然后重试评分。

内部服务器错误: 500

问题描述

尝试联机评分时显示以下消息:内部服务器错误

问题原因

如果联机评分所基于的下游数据流失败,那么会显示此消息。

解决方法

等待一段时间,再尝试在线打分。 如果再次失败,请联系 IBM 支持人员。

ml_artifact 的类型无效:管道

问题描述

当您尝试在工作站上使用公共 API 客户机库发布 Spark 模型时,将显示以下消息。

问题原因

如果在操作系统中设置了无效的 pyspark ,那么将显示此消息。

解决方法

根据指示信息设置系统环境路径:

SPARK_HOME={installed_spark_path}
JAVA_HOME={installed_java_path}
PYTHONPATH=$SPARK_HOME/python/

值错误:如果未给定管道工件,那么 Training_data_ref 名称和连接不能为 None。

问题描述

缺少训练数据集或未正确引用训练数据集。

问题原因

“管道工件”是此实例中的训练数据集。

解决方法

在持久存储 Spark PipelineModel时,必须提供训练数据集。 如果不这样做,客户端就会说它不支持 PipelineModels, 而不是说 PipelineModel 必须与训练集一起提供。

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more