0 / 0
資料の 英語版 に戻る
Watson Machine Learning のトラブルシューティング
最終更新: 2024年9月27日
Watson Machine Learning のトラブルシューティング

以下は、IBM Watson Machine Learning の使用に関する一般的なトラブルシューティングの質問への回答です。

Watson Machine Learning のヘルプとサポートの利用

Watson Machine Learning を使用する際に問題や質問がある場合は、情報を検索したりフォーラムで質問することで助けを得ることができます。 また、サポート・チケットを開くことができます。

フォーラムを使用して質問するときは、Watson Machine Learning 開発チームが見ることができるようにタグ付けしてください。

Watson Machine Learning に関する技術的な質問がある場合は、Stack Overflow 外部リンク・アイコン に質問を投稿し、ibm-bluemixmachine-learning のタグを付けてください。

サービスと開始手順に関する質問については、IBM developerWorks dW Answers 外部リンク・アイコン フォーラムを使用してください。 機械学習ブルーミックスタグを含める必要があります。

内容

Watson Machine Learning で作業する際に遭遇する可能性のある一般的な問題を解決するには、以下のヒントを参考にしてください。

AutoAI 実験のトレーニングがサービス ID 認証情報で失敗する

AutoAI実験をserviceID,トレーニングがこのエラーで失敗することがあります:

User specified in query parameters does not match user from token.

この問題を解決する一つの方法は、ユーザー認証情報を使って実験を実行することである。 サービスの認証情報を使って実験を実行したい場合は、以下の手順に従ってサービス ID のロールとポリシーを更新してください。

  1. serviceIDの場合 IBM Cloudの場合を開いてください。

    serviceIDポリシー・ページを見つける

  2. 新しいserviceIDを作成するか、既存のIDを以下のアクセス・ポリシーで更新する:

    • APIキーのレビュアー、ユーザーAPIキーの作成者、ビュアー、オペレーター、エディターの役割を持つすべてのIAMアカウント管理サービス。 このServiceIdのために新しいapikeyを作成するのが理想的です。serviceIDのポリシーとロールの更新
  3. 更新されたポリシーは以下のようになる:serviceIDポリシーを更新しました

  4. 更新されたserviceIDの認証情報を使用して、再度トレーニングを実行します。

配置スペースからのカスタム基盤モデルの配置に失敗する

配置スペースからカスタム ファウンデーション モデルの配置を作成する場合、さまざま な理由で配置が失敗する可能性があります。 以下のヒントに従って、配置スペースからカスタム ファウンデーション モデルを 配置するときに発生する可能性のある一般的な問題を解決してください。

ケース1:パラメータ値が範囲外である

配置スペースからカスタム基本モデルの配置を作成する場合、基本モデルのパラ メータ値が指定された範囲内にあることを確認する必要があります。 詳細については、カスタム基礎モデルのプロパティとパラメータを参照してください。 指定された範囲を超えた値を入力すると、エラーが発生することがあります。

たとえば、max_new_tokensパラメータの値はmax_sequence_lengthより小さくなければなりません。 ベースモデルのパラメータ値を更新する際、max_new_tokensmax_sequence_lengthの値(2048)以上の値を入力すると、エラーが発生する場合があります。

次の画像はエラーメッセージの例です:Value must be an integer between 20 and 1000000000000000 and be greater than 'Max New Tokens'.

エラー・メッセージの例

モデル・パラメーターのデフォルト値がエラーになる場合は、管理者に連絡して watsonxaiifm CR 内のモデルのレジストリを変更してください。

ケース2:サポートされていないデータ型

カスタム・ファウンデーション・モデルでサポートされているデータ型を選択する必要があります。 ベースモデルのパラメータ値を更新する際に、デプロイ済みモデルのデータ型をサポートされていないデータ型で更新すると、デプロイに失敗することがあります。

例えば、LLaMA-Pro-8B-Instruct-GPTQモデルはfloat16データ型にのみ対応しています。 LLaMA-Pro-8B-Instruct-GPTQ モデルを float16 Enum でデプロイし、Enum パラメータを float16 から bfloat16 に更新すると、デプロイは失敗します。

カスタム基盤モデルに選択したデータ型がエラーになる場合は、配置の作成時にカスタム基盤モデルのデータ型を上書きするか、管理者に連絡して watsonxaiifm CR 内のモデルのレジストリを変更してください。

ケース3:パラメータ値が大きすぎる

パラメータmax_sequence_lengthmax_new_tokenに非常に大きな値を入力すると、エラーになることがあります。 例えば、max_sequence_lengthの値を1000000000000000とした場合、次のようなエラーメッセージが表示されます:

カスタム・ファンデーション・モデルのデプロイに失敗しました。 max_batch_weight (19596417433) が (prefill) max_sequence_length (10000000000000) に対して十分大きくないため、処理に失敗しました。 操作を再試行してください。 問題が解決しない場合は、IBM サポートに連絡してください。

モデルの設定ファイルで定義されている値(config.json)よりも小さい値をパラメータに入力しなければなりません。

ケース 4: model.safetensors ファイルが未サポートのライブラリで保存されている

カスタムファウンデーションモデルのmodel.safetensorsファイルが、メタデータヘッダでサポートされていないデータ形式を使用している場合、デプロイメントに失敗する可能性があります。

たとえば、OccamRazor/mpt-7b-storywriter-4bit-128g カスタム ファンデーション モデルを Hugging Face からデプロイメント スペースにインポートしてオンライン デプロイメントを作成すると、デプロイメントに失敗する可能性があります。 これは、OccamRazor/mpt-7b-storywriter-4bit-128gモデルのmodel.safetensorsファイルが、サポートされていないライブラリであるsave_pretrainedと一緒に保存されているためです。 次のエラー・メッセージが返される場合があります。

'NoneType'オブジェクトに属性'get'がないため、操作に失敗しました。

カスタムファウンデーションモデルが、サポートされているtransformersライブラリで保存されていることを確認する必要があります。

ケース 5:Llama 3.1 モデルの配置に失敗した場合

Llama 3.1 モデルのデプロイに失敗したら、モデルの config.json ファイルの内容を編集してみてください:

  1. eos_token_idの項目を見つけてください。
  2. エントリーの値を配列から整数に変更する。

その後、モデルを再配置してみてください。

展開スペースでの SPSS Modeler フローのジョブの作成に失敗する

展開スペースで SPSS Modeler フローのバッチジョブを構成する過程で、データ資産とそれぞれの接続の自動マッピングに失敗することがあります。

画像は、データ資産と接続の自動マッピングが失敗していることを示しています

データ資産と接続の自動マッピングのエラーを修正するには、以下の手順に従ってください:

  1. Create and saveをクリックして進行状況を保存し、新規ジョブ設定ダイアログボックスから抜けます。

  2. 配置スペースで、Jobs タブをクリックし、SPSS Modeler フロージョブを選択して、ジョブの詳細を確認します。

  3. ジョブ詳細ページで、編集アイコン編集アイコンのイメージをクリックして、データ資産と接続のマッピングを手動で更新します。

  4. データ資産と接続のマッピングを更新した後、新規ジョブダイアログボックスでジョブの設定プロセスを再開できます。 詳細については、SPSS Modeler フロー用の展開ジョブの作成を参照してください

    画像は、データ資産と接続の自動マッピングが成功していることを示しています

非アクティブ Watson Machine Learning インスタンス

症状

プロンプト・ラボのGenerateボタンをクリックして、基礎モデルに推論要求を送信しようとすると、以下のエラーメッセージが表示されます:

'code': 'no_associated_service_instance_error',
'message': 'WML instance {instance_id} status is not active, current status: Inactive'

考えられる原因

watsonx.ai プロジェクトと、関連する Watson Machine Learning サービス インスタンスとの関連付けが失われました。

考えられる解決策

watsonx.ai プロジェクトと、関連する Watson Machine Learning サービス インスタンスとの関連付けを再作成または更新します。 これを行うには、以下のステップを実行します。

  1. メインメニューからプロジェクトを展開し、すべてのプロジェクトを表示をクリックします。
  2. watsonx.ai プロジェクトをクリックします。
  3. 管理タブから、サービスと統合をクリックします。
  4. 該当する Watson Machine Learning サービス インスタンスが表示されている場合は、インスタンスを選択し、Remove をクリックして一時的に関連付けを解除します。 削除を確認する。
  5. サービスを関連付けるをクリックします。
  6. リストから適切な Watson Machine Learning サービスインスタンスを選択し、Associate をクリックします。

認証トークンが指定されていません。

現象

REST API を正常に呼び出すことができません。

現象の理由

認証トークンはAuthorizationヘッダでは提供されません。

修正方法

Authorizationヘッダーに認可トークンを渡します。

無効な許可トークン。

現象

REST API を正常に呼び出すことができません。

現象の理由

提供された認証トークンを解読または解析できない。

修正方法

Authorizationヘッダーに正しい認証トークンを渡します。

リクエストで使用された認証トークンとinstance_idが異なる。

現象

REST API を正常に呼び出すことができません。

現象の理由

使用された認証トークンは、それが使用されたサービスインスタンスに対して生成されません。

修正方法

Authorizationヘッダーに、使用するサービスインスタンスに対応する認可トークンを渡します。

認証トークンの有効期限が切れています。

現象

REST API を正常に呼び出すことができません。

現象の理由

認証トークンの有効期限が切れています。

修正方法

期限が切れていない許可トークンを Authorization ヘッダーに入れて渡してください。

認証に必要な公開鍵が利用できない。

現象

REST API を正常に呼び出すことができません。

現象の理由

この問題は、内部サービスの問題で起こる可能性がある。

修正方法

サポートチームに連絡する。

{{timeout}}の後にタイムアウトした操作

現象

REST API を正常に呼び出すことができません。

現象の理由

要求された操作の実行中にタイムアウトが発生した。

修正方法

もう一度操作を行ってください。

{{status}} でタイプ {{type}} の処理されない例外

現象

REST API を正常に呼び出すことができません。

現象の理由

この問題は、内部サービスの問題で起こる可能性がある。

修正方法

もう一度操作を行ってください。 また同じことが起こるようであれば、サポートチームに連絡してください。

{{response}} でタイプ {{type}} の処理されない例外

現象

REST API を正常に呼び出すことができません。

現象の理由

この問題は、内部サービスの問題で起こる可能性がある。

修正方法

もう一度操作を行ってください。 また同じことが起こるようであれば、サポートチームに連絡してください。

{{json}} でタイプ {{type}} の処理されない例外

現象

REST API を正常に呼び出すことができません。

現象の理由

この問題は、内部サービスの問題で起こる可能性がある。

修正方法

もう一度操作を行ってください。 また同じことが起こるようであれば、サポートチームに連絡してください。

{{message}} でタイプ {{type}} の処理されない例外

現象

REST API を正常に呼び出すことができません。

現象の理由

この問題は、内部サービスの問題で起こる可能性がある。

修正方法

もう一度操作を行ってください。 また同じことが起こるようであれば、サポートチームに連絡してください。

要求されたオブジェクトが見つかりません。

現象

REST API を正常に呼び出すことができません。

現象の理由

リクエスト・リソースが見つかりません。

修正方法

既存のリソースを参照していることを確認してください。

基礎となるデータベースがあまりにも多くのリクエストを報告しました。

現象

REST API を正常に呼び出すことができません。

現象の理由

ユーザーが特定の時間に送信したリクエストが多すぎる。

修正方法

もう一度操作を行ってください。

評価の定義は、artifactModelVersion やデプロイメントでは定義されていません。 少なくとも1箇所は指定しなければならない。

現象

REST API を正常に呼び出すことができません。

現象の理由

学習設定に必要な情報がすべて含まれていない

修正方法

learning configuration 内に definition を指定してください。

評価には、モデルに指定された学習コンフィギュレーションが必要である。

現象

learning iterationを作成することはできません。

現象の理由

learning configurationはモデルに定義されていません。

修正方法

learning configuration を作成し、learning iteration の作成を再試行してください。

評価は、X-Spark-Service-Instance ヘッダー内に spark インスタンスが指定されることを必要とします。

現象

REST API を正常に呼び出すことができません。

現象の理由

learning configurationには必要な情報がありません。

修正方法

spark_serviceをLearning ConfigurationまたはX-Spark-Service-Instanceヘッダに記述してください。

モデルにバージョンが含まれていません。

現象

デプロイメントの作成やlearning configurationの設定はできません。

現象の理由

この問題は、モデルの永続性に関連する不整合によって起こる可能性がある。

修正方法

再度モデルを永続化し、アクションを実行してみてください。

IBM Federated Learning でデータ・モジュールが見つかりません。

現象

IBM Federated Learning のデータ・ハンドラーが FL ライブラリーからデータ・モジュールを抽出しようとしましたが、見つかりません。 以下のエラー・メッセージが表示される場合があります。

ModuleNotFoundError: No module named 'ibmfl.util.datasets'

現象の理由

古い DataHandler である可能性があります。

修正方法

DataHandler を最新の MNIST データ・ハンドラ に適合するように更新するか、サンプルのバージョンが最新であることを確認してください。

パッチ操作は、既存の学習コンフィギュレーションのみを変更することができる。

現象

学習コンフィギュレーションにパッチを適用するために、patch REST APIメソッドを呼び出すことはできません。

現象の理由

learning configurationがこのモデルに設定されていないか、モデルが存在しません。

修正方法

モデルが存在し、既に learning configuration が設定されていることを確認してください。

パッチ操作は、1 つの置換操作を予期しています。

現象

デプロイメントにパッチを行うことができません。

現象の理由

パッチのペイロードに複数の操作が含まれているか、パッチ操作が replace 以外です。

修正方法

パッチのペイロードでは、replaceオペレーションを1つだけ使ってください。

ペイロードに必須フィールドがない:FIELD フィールドがないか、フィールドの値が壊れています。

現象

基礎となるデータセットへのアクセスに関連するアクションを処理することはできない。

現象の理由

データ・セットへのアクセスが適切に定義されていません。

修正方法

データ・セットのアクセス定義を修正してください。

指定された評価メソッド: METHOD はサポートされていません。 サポートされる値: VALUE。

現象

学習コンフィギュレーションを作成することはできない。

現象の理由

正しくない評価メソッドが learning configuration を作成するために使用されました。

修正方法

サポートされている評価方法を使用する:regression, binary, multiclass のいずれかです。

1つのモデルにつきアクティブな評価は1つだけです。 アクティブな評価があるため、リクエストを完了できません:{{url}}

現象

別の学習反復を行うことはできない。

現象の理由

モデルに対する実行中の評価は1つだけです。

修正方法

すでに実行されている評価を見るか、評価の終了を待って新しい評価を開始する。

デプロイメント・タイプ {{type}} はサポートされていません。

現象

デプロイメントを作成することはできません。

現象の理由

サポートされていないデプロイメント・タイプが使用されました。

修正方法

サポートされている配置タイプを使用する必要があります。

入力が正しくありません: ({{message}})

現象

REST API を正常に呼び出すことができません。

現象の理由

この問題は、JSONの解析に問題があるために発生する。

修正方法

リクエストに正しいJSONが渡されていることを確認する。

データ不足 - メトリック {{name}}は計算できません

現象

学習反復は失敗した。

現象の理由

フィードバックデータが不十分なため、定義されたしきい値を持つ指標の値が計算できない。

修正方法

learning configuration 内でデータ・ソース feedback_data_ref のデータを確認して改善してください。

タイプ {{type}} の場合、X-Spark-Service-Instance ヘッダー内に spark インスタンスが指定される必要があります

現象

デプロイメントを作成できません

現象の理由

batch デプロイメントおよび streaming デプロイメントは、spark インスタンスの指定を必要とします

修正方法

X-Spark-Service-Instance ヘッダー内に spark インスタンスを指定してください

アクション {{action}} はメッセージ {{message}} で失敗しました

現象

REST API を正常に呼び出すことができません。

現象の理由

この問題は、基礎となるサービスの呼び出しに問題があるために起こります。

修正方法

メッセージに問題を解決するための提案がある場合は、その提案に従ってください。 そうでない場合は、サポート・チームにご連絡ください。

パス {{path}} は許可されません。 パッチストリームに許される唯一のパスは /status です

現象

ストリームデプロイメントにパッチを当てることはできない。

現象の理由

stream デプロイメントのパッチに、正しくないパスが使用されました。

修正方法

stream デプロイメントに、サポートされているパスオプション /status をパッチしてください (ストリーム処理の開始/停止ができます)。

例えば{{$type}}のようなパッチ操作は許されない

現象

パッチを当てることができない。

現象の理由

パッチの対象にしようとしているデプロイメント・タイプが正しくありません。

修正方法

stream デプロイメント・タイプにパッチを行ってください。

データ接続 {{data}} は feedback_data_ref には無効です

現象

learning configurationはモデルに作成できません。

現象の理由

feedback_data_refが定義されているときに、サポートされているデータソースが使用されませんでした。

修正方法

サポートされているデータソースタイプdashdbのみを使用してください。

パス {{path}} は許可されません。 パッチモデルに許される唯一のパスは、V2 の場合は /deployed_version/url または /deployed_version/href です

現象

モデルにパッチを当てるオプションはない。

現象の理由

モデルのパッチを実行中に、正しくないパスが使用されました。

修正方法

デプロイされたモデルのバージョンを更新するために使用できる、サポートされたパスを持つパッチモデル。

構文解析失敗: {{msg}}

現象

REST API を正常に呼び出すことができません。

現象の理由

要求されたペイロードは正常に解析できません。

修正方法

リクエストのペイロードが正しく、正しく解析できることを確認してください。

選択されたモデルのランタイム環境: {{env}} は、learning configuration にはサポートされません。 サポートされる環境: [{{supported_envs}}]。

現象

learning configurationを作成するオプションはありません。

現象の理由

learning_configuration を作成しようとしたモデルはサポートされていません。

修正方法

サポートされているランタイムを持つモデル用にlearning configurationを作成します。

現在のプラン '{{plan}}' では、{{limit}} でのみデプロイが可能です

現象

デプロイメントを作成することはできません。

現象の理由

現在のプランでのデプロイメント数の限度に達しました。

修正方法

そのような制限のないプランにアップグレードする。

データベース接続定義が無効です ({{code}})

現象

learning configuration関数を使うことはできません。

現象の理由

データベース接続定義が無効です。

修正方法

基礎となるデータベースから返されたcodeで説明されている問題を修正してみてください。

基礎となる{{system}}への接続に問題がある

現象

REST API を正常に呼び出すことができません。

現象の理由

この問題は、基礎となるシステムへの接続中に問題が発生したために起こる可能性があります。 一時的なネットワークの問題かもしれない。

修正方法

もう一度操作を行ってください。 再びエラーが発生した場合は、サポートチームまでご連絡ください。

X-Spark-Service-Instance ヘッダーの抽出でエラー: ({{message}})

現象

この問題は、Sparkの認証情報を必要とするREST APIが呼び出せない場合に発生する可能性がある。

現象の理由

この問題は、base-64 による Spark クレデンシャルのデコードまたは解析の問題によって発生する可能性があります。

修正方法

正しいSpark認証情報が正しくbase-64エンコードされていることを確認してください。 詳しくは、資料を参照してください。

この機能はベータ版以外のユーザーには禁止されている。

現象

REST API を正常に呼び出すことができません。

現象の理由

呼び出されたREST APIはベータ版である。

修正方法

参加をご希望の場合は、ご自身を待機リストに追加してください。 詳細はドキュメントを参照されたい。

{{code}} {{message}}

現象

REST API を正常に呼び出すことができません。

現象の理由

この問題は、基礎となるサービスの呼び出しに問題があるために発生する可能性があります。

修正方法

メッセージに問題を解決するための提案がある場合は、その提案に従ってください。 そうでない場合は、サポート・チームにご連絡ください。

速度制限を超えました。

現象

速度制限を超えました。

現象の理由

現在のプランの料金の上限を超えている。

修正方法

この問題を解決するには、速度制限がもっと大きい別のプランを獲得してください。

無効な照会パラメーター {{paramName}} 値: {{value}}

現象

正しくない照会パラメーター値が渡されたため、妥当性検査エラーが発生しました。

現象の理由

照会結果の取得でエラー。

修正方法

照会パラメーター値を修正してください。 詳細はドキュメントを参照されたい。

無効なトークン・タイプ: {{type}}

現象

トークン・タイプに関するエラー。

現象の理由

許可でのエラー。

修正方法

トークンは Bearer 接頭辞で始まる必要があります。

無効なトークン・フォーマットです。 ベアラートークン形式を使用する必要があります。

現象

トークン・フォーマットに関するエラー。

現象の理由

許可でのエラー。

修正方法

トークンはベアラートークンでなければならず、Bearer接頭辞で始まらなければなりません。

入力 JSON ファイルが欠落しているか、無効です: 400

現象

オンラインでのスコアリングを試行中に次のメッセージが表示されます: 入力 JSON ファイルが欠落しているか、無効です

現象の理由

このメッセージは、入力ペイロードのスコアリングが、モデルのスコアリングに必要な予期される入力タイプと一致しない場合に表示されます。 具体的には、以下のような理由が考えられる:

  • 入力ペイロードが空である。
  • 入力ペイロード・スキーマが無効である。
  • 入力データ型が期待されるデータ型と一致しない。

修正方法

入力ペイロードを修正してください。 ペイロードの構文が正しく、スキーマが有効であり、データ・タイプが適切であることを確認してください。 修正後、オンラインでのスコアリングを再試行してください。 構文の問題の場合、jsonlint コマンドを使用して JSON ファイルを検証してください。

認証トークンの有効期限が切れています:401

現象

オンラインでのスコアリングを試行中に次のメッセージが表示されます: 許可は失敗しました

現象の理由

このメッセージは、採点に使用されるトークンの有効期限が切れたときに表示されます。

修正方法

このIBM Watson Machine Learningインスタンスのトークンを再生成し、再試行します。 それでもこの問題が起こる場合は、IBM サポートにお問い合わせください。

不明な配備の識別404

現象

オンラインでのスコアリングを試行中に次のメッセージが表示されます: 不明デプロイメント ID

現象の理由

このメッセージは、採点に使用する配置 ID が存在しない場合に表示されます。

修正方法

正しいデプロイメント ID を指定していることを確認してください。 そうでない場合、そのデプロイメント ID のモデルをデプロイし、その後でスコアリングを再試行してください。

内部サーバーエラー:500

現象

オンラインでのスコアリングを試行中に次のメッセージが表示されます: 内部サーバー・エラー

現象の理由

このメッセージは、オンラインでのスコアリングが依存している下流データ・フローが失敗した場合に表示されます。

修正方法

しばらく時間をおいてから、再びオンラインで得点を狙う。 再び失敗した場合は、IBM サポートに連絡してください。

無効な ml_artifact のタイプ: パイプライン

現象

ワークステーションで Common API クライアントライブラリを使用して Spark モデルを公開しようとすると、次のメッセージが表示されます。

現象の理由

このメッセージは、オペレーティングシステムに無効なpysparkがセットアップされている場合に表示されます。

修正方法

以下の手順に従ってシステム環境パスをセットアップします。

SPARK_HOME={installed_spark_path}
JAVA_HOME={installed_java_path}
PYTHONPATH=$SPARK_HOME/python/

値エラー: パイプライン成果物を指定していない場合、Training_data_ref 名および接続を「なし」にすることはできません。

現象

トレーニングデータセットがないか、正しく参照されていない。

現象の理由

パイプライン成果物がこのインスタンスでのトレーニング・データ・セットです。

修正方法

Spark PipelineModel を永続化する際には、トレーニングデータセットを提供する必要があります。 もしそうしなければ、クライアントはPipelineModels,をサポートしていないと言い、むしろPipelineModelがトレーニングセットを伴わなければならないと言います。

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細