以下は、IBM Watson Machine Learning の使用に関する一般的なトラブルシューティングの質問への回答です。
Watson Machine Learning のヘルプとサポートの利用
Watson Machine Learning を使用する際に問題や質問がある場合は、情報を検索したりフォーラムで質問することで助けを得ることができます。 また、サポート・チケットを開くことができます。
フォーラムを使用して質問するときは、Watson Machine Learning 開発チームが見ることができるようにタグ付けしてください。
Watson Machine Learning に関する技術的な質問がある場合は、Stack Overflow に質問を投稿し、ibm-bluemix と machine-learning のタグを付けてください。
サービスと開始手順に関する質問については、IBM developerWorks dW Answers フォーラムを使用してください。 機械学習とブルーミックスタグを含める必要があります。
内容
artifactModelVersion にもデプロイメントにも評価の定義が定義されていません。 少なくともいずれかの場所に指定される必要があります
評価では、
X-Spark-Service-Instance
ヘッダーに Spark インスタンスを指定する必要があります。1つのモデルにつきアクティブな評価は1つだけです。 既存のアクティブな評価のため、リクエストは完了しないかもしれません:{{url}}
タイプ {{type}} の場合、
X-Spark-Service-Instance
ヘッダーに spark インスタンスを指定する必要があります。パス {{path}} は許可されません。 パッチモデルに許可されるパスは、
/deployed_version/url
または V2 の/deployed_version/href
だけです選択されたモデル {{env}} のランタイム環境は、
learning configuration
ではサポートされていません。 サポートされる環境: -[{{supported_envs}}]値エラー: パイプライン成果物を指定していない場合、Training_data_ref 名および接続を「なし」にすることはできません。
Watson Machine Learning で作業する際に遭遇する可能性のある一般的な問題を解決するには、以下のヒントを参考にしてください。
AutoAI 実験のトレーニングがサービス ID 認証情報で失敗する
AutoAI実験をserviceID,トレーニングがこのエラーで失敗することがあります:
User specified in query parameters does not match user from token.
この問題を解決する一つの方法は、ユーザー認証情報を使って実験を実行することである。 サービスの認証情報を使って実験を実行したい場合は、以下の手順に従ってサービス ID のロールとポリシーを更新してください。
serviceIDの場合 IBM Cloudの場合を開いてください。
新しいserviceIDを作成するか、既存のIDを以下のアクセス・ポリシーで更新する:
- APIキーのレビュアー、ユーザーAPIキーの作成者、ビュアー、オペレーター、エディターの役割を持つすべてのIAMアカウント管理サービス。 このServiceIdのために新しいapikeyを作成するのが理想的です。
更新されたポリシーは以下のようになる:
更新されたserviceIDの認証情報を使用して、再度トレーニングを実行します。
配置スペースからのカスタム基盤モデルの配置に失敗する
配置スペースからカスタム ファウンデーション モデルの配置を作成する場合、さまざま な理由で配置が失敗する可能性があります。 以下のヒントに従って、配置スペースからカスタム ファウンデーション モデルを 配置するときに発生する可能性のある一般的な問題を解決してください。
ケース1:パラメータ値が範囲外である
配置スペースからカスタム基本モデルの配置を作成する場合、基本モデルのパラ メータ値が指定された範囲内にあることを確認する必要があります。 詳細については、カスタム基礎モデルのプロパティとパラメータを参照してください。 指定された範囲を超えた値を入力すると、エラーが発生することがあります。
たとえば、max_new_tokens
パラメータの値はmax_sequence_length
より小さくなければなりません。 ベースモデルのパラメータ値を更新する際、max_new_tokens
にmax_sequence_length
の値(2048)以上の値を入力すると、エラーが発生する場合があります。
次の画像はエラーメッセージの例です:Value must be an integer between 20 and 1000000000000000 and be greater than 'Max New Tokens'
.
モデル・パラメーターのデフォルト値がエラーになる場合は、管理者に連絡して watsonxaiifm CR 内のモデルのレジストリを変更してください。
ケース2:サポートされていないデータ型
カスタム・ファウンデーション・モデルでサポートされているデータ型を選択する必要があります。 ベースモデルのパラメータ値を更新する際に、デプロイ済みモデルのデータ型をサポートされていないデータ型で更新すると、デプロイに失敗することがあります。
例えば、LLaMA-Pro-8B-Instruct-GPTQ
モデルはfloat16
データ型にのみ対応しています。 LLaMA-Pro-8B-Instruct-GPTQ
モデルを float16
Enum
でデプロイし、Enum
パラメータを float16
から bfloat16
に更新すると、デプロイは失敗します。
カスタム基盤モデルに選択したデータ型がエラーになる場合は、配置の作成時にカスタム基盤モデルのデータ型を上書きするか、管理者に連絡して watsonxaiifm CR 内のモデルのレジストリを変更してください。
ケース3:パラメータ値が大きすぎる
パラメータmax_sequence_length
とmax_new_token
に非常に大きな値を入力すると、エラーになることがあります。 例えば、max_sequence_length
の値を1000000000000000
とした場合、次のようなエラーメッセージが表示されます:
カスタム・ファンデーション・モデルのデプロイに失敗しました。 max_batch_weight (19596417433) が (prefill) max_sequence_length (10000000000000) に対して十分大きくないため、処理に失敗しました。 操作を再試行してください。 問題が解決しない場合は、IBM サポートに連絡してください。
モデルの設定ファイルで定義されている値(config.json
)よりも小さい値をパラメータに入力しなければなりません。
ケース 4: model.safetensors
ファイルが未サポートのライブラリで保存されている
カスタムファウンデーションモデルのmodel.safetensors
ファイルが、メタデータヘッダでサポートされていないデータ形式を使用している場合、デプロイメントに失敗する可能性があります。
たとえば、OccamRazor/mpt-7b-storywriter-4bit-128g
カスタム ファンデーション モデルを Hugging Face からデプロイメント スペースにインポートしてオンライン デプロイメントを作成すると、デプロイメントに失敗する可能性があります。 これは、OccamRazor/mpt-7b-storywriter-4bit-128g
モデルのmodel.safetensors
ファイルが、サポートされていないライブラリであるsave_pretrained
と一緒に保存されているためです。 次のエラー・メッセージが返される場合があります。
'NoneType'オブジェクトに属性'get'がないため、操作に失敗しました。
カスタムファウンデーションモデルが、サポートされているtransformers
ライブラリで保存されていることを確認する必要があります。
ケース 5:Llama 3.1 モデルの配置に失敗した場合
Llama 3.1 モデルのデプロイに失敗したら、モデルの config.json
ファイルの内容を編集してみてください:
eos_token_id
の項目を見つけてください。- エントリーの値を配列から整数に変更する。
その後、モデルを再配置してみてください。
展開スペースでの SPSS Modeler フローのジョブの作成に失敗する
展開スペースで SPSS Modeler フローのバッチジョブを構成する過程で、データ資産とそれぞれの接続の自動マッピングに失敗することがあります。
データ資産と接続の自動マッピングのエラーを修正するには、以下の手順に従ってください:
Create and saveをクリックして進行状況を保存し、新規ジョブ設定ダイアログボックスから抜けます。
配置スペースで、Jobs タブをクリックし、SPSS Modeler フロージョブを選択して、ジョブの詳細を確認します。
ジョブ詳細ページで、編集アイコンをクリックして、データ資産と接続のマッピングを手動で更新します。
データ資産と接続のマッピングを更新した後、新規ジョブダイアログボックスでジョブの設定プロセスを再開できます。 詳細については、SPSS Modeler フロー用の展開ジョブの作成を参照してください
非アクティブ Watson Machine Learning インスタンス
症状
プロンプト・ラボのGenerateボタンをクリックして、基礎モデルに推論要求を送信しようとすると、以下のエラーメッセージが表示されます:
'code': 'no_associated_service_instance_error',
'message': 'WML instance {instance_id} status is not active, current status: Inactive'
考えられる原因
watsonx.ai プロジェクトと、関連する Watson Machine Learning サービス インスタンスとの関連付けが失われました。
考えられる解決策
watsonx.ai プロジェクトと、関連する Watson Machine Learning サービス インスタンスとの関連付けを再作成または更新します。 これを行うには、以下のステップを実行します。
- メインメニューからプロジェクトを展開し、すべてのプロジェクトを表示をクリックします。
- watsonx.ai プロジェクトをクリックします。
- 管理タブから、サービスと統合をクリックします。
- 該当する Watson Machine Learning サービス インスタンスが表示されている場合は、インスタンスを選択し、Remove をクリックして一時的に関連付けを解除します。 削除を確認する。
- サービスを関連付けるをクリックします。
- リストから適切な Watson Machine Learning サービスインスタンスを選択し、Associate をクリックします。
認証に必要な公開鍵が利用できない。
現象
REST API を正常に呼び出すことができません。
現象の理由
この問題は、内部サービスの問題で起こる可能性がある。
修正方法
サポートチームに連絡する。
{{timeout}}の後にタイムアウトした操作
現象
REST API を正常に呼び出すことができません。
現象の理由
要求された操作の実行中にタイムアウトが発生した。
修正方法
もう一度操作を行ってください。
{{status}} でタイプ {{type}} の処理されない例外
現象
REST API を正常に呼び出すことができません。
現象の理由
この問題は、内部サービスの問題で起こる可能性がある。
修正方法
もう一度操作を行ってください。 また同じことが起こるようであれば、サポートチームに連絡してください。
{{response}} でタイプ {{type}} の処理されない例外
現象
REST API を正常に呼び出すことができません。
現象の理由
この問題は、内部サービスの問題で起こる可能性がある。
修正方法
もう一度操作を行ってください。 また同じことが起こるようであれば、サポートチームに連絡してください。
{{json}} でタイプ {{type}} の処理されない例外
現象
REST API を正常に呼び出すことができません。
現象の理由
この問題は、内部サービスの問題で起こる可能性がある。
修正方法
もう一度操作を行ってください。 また同じことが起こるようであれば、サポートチームに連絡してください。
{{message}} でタイプ {{type}} の処理されない例外
現象
REST API を正常に呼び出すことができません。
現象の理由
この問題は、内部サービスの問題で起こる可能性がある。
修正方法
もう一度操作を行ってください。 また同じことが起こるようであれば、サポートチームに連絡してください。
要求されたオブジェクトが見つかりません。
現象
REST API を正常に呼び出すことができません。
現象の理由
リクエスト・リソースが見つかりません。
修正方法
既存のリソースを参照していることを確認してください。
基礎となるデータベースがあまりにも多くのリクエストを報告しました。
現象
REST API を正常に呼び出すことができません。
現象の理由
ユーザーが特定の時間に送信したリクエストが多すぎる。
修正方法
もう一度操作を行ってください。
評価の定義は、artifactModelVersion やデプロイメントでは定義されていません。 少なくとも1箇所は指定しなければならない。
現象
REST API を正常に呼び出すことができません。
現象の理由
学習設定に必要な情報がすべて含まれていない
修正方法
learning configuration
内に definition
を指定してください。
評価には、モデルに指定された学習コンフィギュレーションが必要である。
現象
learning iteration
を作成することはできません。
現象の理由
learning configuration
はモデルに定義されていません。
修正方法
learning configuration
を作成し、learning iteration
の作成を再試行してください。
評価は、X-Spark-Service-Instance
ヘッダー内に spark インスタンスが指定されることを必要とします。
現象
REST API を正常に呼び出すことができません。
現象の理由
learning configuration
には必要な情報がありません。
修正方法
spark_service
をLearning ConfigurationまたはX-Spark-Service-Instance
ヘッダに記述してください。
モデルにバージョンが含まれていません。
現象
デプロイメントの作成やlearning configuration
の設定はできません。
現象の理由
この問題は、モデルの永続性に関連する不整合によって起こる可能性がある。
修正方法
再度モデルを永続化し、アクションを実行してみてください。
IBM Federated Learning でデータ・モジュールが見つかりません。
現象
IBM Federated Learning のデータ・ハンドラーが FL ライブラリーからデータ・モジュールを抽出しようとしましたが、見つかりません。 以下のエラー・メッセージが表示される場合があります。
ModuleNotFoundError: No module named 'ibmfl.util.datasets'
現象の理由
古い DataHandler である可能性があります。
修正方法
DataHandler を最新の MNIST データ・ハンドラ に適合するように更新するか、サンプルのバージョンが最新であることを確認してください。
パッチ操作は、既存の学習コンフィギュレーションのみを変更することができる。
現象
学習コンフィギュレーションにパッチを適用するために、patch REST APIメソッドを呼び出すことはできません。
現象の理由
learning configuration
がこのモデルに設定されていないか、モデルが存在しません。
修正方法
モデルが存在し、既に learning configuration が設定されていることを確認してください。
パッチ操作は、1 つの置換操作を予期しています。
現象
デプロイメントにパッチを行うことができません。
現象の理由
パッチのペイロードに複数の操作が含まれているか、パッチ操作が replace
以外です。
修正方法
パッチのペイロードでは、replace
オペレーションを1つだけ使ってください。
ペイロードに必須フィールドがない:FIELD フィールドがないか、フィールドの値が壊れています。
現象
基礎となるデータセットへのアクセスに関連するアクションを処理することはできない。
現象の理由
データ・セットへのアクセスが適切に定義されていません。
修正方法
データ・セットのアクセス定義を修正してください。
指定された評価メソッド: METHOD はサポートされていません。 サポートされる値: VALUE。
現象
学習コンフィギュレーションを作成することはできない。
現象の理由
正しくない評価メソッドが learning configuration を作成するために使用されました。
修正方法
サポートされている評価方法を使用する:regression
, binary
, multiclass
のいずれかです。
1つのモデルにつきアクティブな評価は1つだけです。 アクティブな評価があるため、リクエストを完了できません:{{url}}
現象
別の学習反復を行うことはできない。
現象の理由
モデルに対する実行中の評価は1つだけです。
修正方法
すでに実行されている評価を見るか、評価の終了を待って新しい評価を開始する。
デプロイメント・タイプ {{type}} はサポートされていません。
現象
デプロイメントを作成することはできません。
現象の理由
サポートされていないデプロイメント・タイプが使用されました。
修正方法
サポートされている配置タイプを使用する必要があります。
入力が正しくありません: ({{message}})
現象
REST API を正常に呼び出すことができません。
現象の理由
この問題は、JSONの解析に問題があるために発生する。
修正方法
リクエストに正しいJSONが渡されていることを確認する。
データ不足 - メトリック {{name}}は計算できません
現象
学習反復は失敗した。
現象の理由
フィードバックデータが不十分なため、定義されたしきい値を持つ指標の値が計算できない。
修正方法
learning configuration
内でデータ・ソース feedback_data_ref
のデータを確認して改善してください。
タイプ {{type}} の場合、X-Spark-Service-Instance
ヘッダー内に spark インスタンスが指定される必要があります
現象
デプロイメントを作成できません
現象の理由
batch
デプロイメントおよび streaming
デプロイメントは、spark インスタンスの指定を必要とします
修正方法
X-Spark-Service-Instance
ヘッダー内に spark インスタンスを指定してください
アクション {{action}} はメッセージ {{message}} で失敗しました
現象
REST API を正常に呼び出すことができません。
現象の理由
この問題は、基礎となるサービスの呼び出しに問題があるために起こります。
修正方法
メッセージに問題を解決するための提案がある場合は、その提案に従ってください。 そうでない場合は、サポート・チームにご連絡ください。
パス {{path}}
は許可されません。 パッチストリームに許される唯一のパスは /status
です
現象
ストリームデプロイメントにパッチを当てることはできない。
現象の理由
stream
デプロイメントのパッチに、正しくないパスが使用されました。
修正方法
stream
デプロイメントに、サポートされているパスオプション /status
をパッチしてください (ストリーム処理の開始/停止ができます)。
例えば{{$type}}
のようなパッチ操作は許されない
現象
パッチを当てることができない。
現象の理由
パッチの対象にしようとしているデプロイメント・タイプが正しくありません。
修正方法
stream
デプロイメント・タイプにパッチを行ってください。
データ接続 {{data}}
は feedback_data_ref には無効です
現象
learning configuration
はモデルに作成できません。
現象の理由
feedback_data_ref
が定義されているときに、サポートされているデータソースが使用されませんでした。
修正方法
サポートされているデータソースタイプdashdb
のみを使用してください。
パス {{path}} は許可されません。 パッチモデルに許される唯一のパスは、V2 の場合は /deployed_version/url
または /deployed_version/href
です
現象
モデルにパッチを当てるオプションはない。
現象の理由
モデルのパッチを実行中に、正しくないパスが使用されました。
修正方法
デプロイされたモデルのバージョンを更新するために使用できる、サポートされたパスを持つパッチモデル。
構文解析失敗: {{msg}}
現象
REST API を正常に呼び出すことができません。
現象の理由
要求されたペイロードは正常に解析できません。
修正方法
リクエストのペイロードが正しく、正しく解析できることを確認してください。
選択されたモデルのランタイム環境: {{env}} は、learning configuration
にはサポートされません。 サポートされる環境: [{{supported_envs}}]。
現象
learning configuration
を作成するオプションはありません。
現象の理由
learning_configuration
を作成しようとしたモデルはサポートされていません。
修正方法
サポートされているランタイムを持つモデル用にlearning configuration
を作成します。
現在のプラン '{{plan}}' では、{{limit}} でのみデプロイが可能です
現象
デプロイメントを作成することはできません。
現象の理由
現在のプランでのデプロイメント数の限度に達しました。
修正方法
そのような制限のないプランにアップグレードする。
データベース接続定義が無効です ({{code}})
現象
learning configuration
関数を使うことはできません。
現象の理由
データベース接続定義が無効です。
修正方法
基礎となるデータベースから返されたcode
で説明されている問題を修正してみてください。
基礎となる{{system}}への接続に問題がある
現象
REST API を正常に呼び出すことができません。
現象の理由
この問題は、基礎となるシステムへの接続中に問題が発生したために起こる可能性があります。 一時的なネットワークの問題かもしれない。
修正方法
もう一度操作を行ってください。 再びエラーが発生した場合は、サポートチームまでご連絡ください。
X-Spark-Service-Instance ヘッダーの抽出でエラー: ({{message}})
現象
この問題は、Sparkの認証情報を必要とするREST APIが呼び出せない場合に発生する可能性がある。
現象の理由
この問題は、base-64 による Spark クレデンシャルのデコードまたは解析の問題によって発生する可能性があります。
修正方法
正しいSpark認証情報が正しくbase-64エンコードされていることを確認してください。 詳しくは、資料を参照してください。
この機能はベータ版以外のユーザーには禁止されている。
現象
REST API を正常に呼び出すことができません。
現象の理由
呼び出されたREST APIはベータ版である。
修正方法
参加をご希望の場合は、ご自身を待機リストに追加してください。 詳細はドキュメントを参照されたい。
{{code}} {{message}}
現象
REST API を正常に呼び出すことができません。
現象の理由
この問題は、基礎となるサービスの呼び出しに問題があるために発生する可能性があります。
修正方法
メッセージに問題を解決するための提案がある場合は、その提案に従ってください。 そうでない場合は、サポート・チームにご連絡ください。
速度制限を超えました。
現象
速度制限を超えました。
現象の理由
現在のプランの料金の上限を超えている。
修正方法
この問題を解決するには、速度制限がもっと大きい別のプランを獲得してください。
無効な照会パラメーター {{paramName}}
値: {{value}}
現象
正しくない照会パラメーター値が渡されたため、妥当性検査エラーが発生しました。
現象の理由
照会結果の取得でエラー。
修正方法
照会パラメーター値を修正してください。 詳細はドキュメントを参照されたい。
無効なトークン・タイプ: {{type}}
現象
トークン・タイプに関するエラー。
現象の理由
許可でのエラー。
修正方法
トークンは Bearer
接頭辞で始まる必要があります。
無効なトークン・フォーマットです。 ベアラートークン形式を使用する必要があります。
現象
トークン・フォーマットに関するエラー。
現象の理由
許可でのエラー。
修正方法
トークンはベアラートークンでなければならず、Bearer
接頭辞で始まらなければなりません。
入力 JSON ファイルが欠落しているか、無効です: 400
現象
オンラインでのスコアリングを試行中に次のメッセージが表示されます: 入力 JSON ファイルが欠落しているか、無効です。
現象の理由
このメッセージは、入力ペイロードのスコアリングが、モデルのスコアリングに必要な予期される入力タイプと一致しない場合に表示されます。 具体的には、以下のような理由が考えられる:
- 入力ペイロードが空である。
- 入力ペイロード・スキーマが無効である。
- 入力データ型が期待されるデータ型と一致しない。
修正方法
入力ペイロードを修正してください。 ペイロードの構文が正しく、スキーマが有効であり、データ・タイプが適切であることを確認してください。 修正後、オンラインでのスコアリングを再試行してください。 構文の問題の場合、jsonlint
コマンドを使用して JSON ファイルを検証してください。
不明な配備の識別404
現象
オンラインでのスコアリングを試行中に次のメッセージが表示されます: 不明デプロイメント ID。
現象の理由
このメッセージは、採点に使用する配置 ID が存在しない場合に表示されます。
修正方法
正しいデプロイメント ID を指定していることを確認してください。 そうでない場合、そのデプロイメント ID のモデルをデプロイし、その後でスコアリングを再試行してください。
内部サーバーエラー:500
現象
オンラインでのスコアリングを試行中に次のメッセージが表示されます: 内部サーバー・エラー
現象の理由
このメッセージは、オンラインでのスコアリングが依存している下流データ・フローが失敗した場合に表示されます。
修正方法
しばらく時間をおいてから、再びオンラインで得点を狙う。 再び失敗した場合は、IBM サポートに連絡してください。
無効な ml_artifact のタイプ: パイプライン
現象
ワークステーションで Common API クライアントライブラリを使用して Spark モデルを公開しようとすると、次のメッセージが表示されます。
現象の理由
このメッセージは、オペレーティングシステムに無効なpysparkがセットアップされている場合に表示されます。
修正方法
以下の手順に従ってシステム環境パスをセットアップします。
SPARK_HOME={installed_spark_path}
JAVA_HOME={installed_java_path}
PYTHONPATH=$SPARK_HOME/python/
値エラー: パイプライン成果物を指定していない場合、Training_data_ref 名および接続を「なし」にすることはできません。
現象
トレーニングデータセットがないか、正しく参照されていない。
現象の理由
パイプライン成果物がこのインスタンスでのトレーニング・データ・セットです。
修正方法
Spark PipelineModel を永続化する際には、トレーニングデータセットを提供する必要があります。 もしそうしなければ、クライアントはPipelineModels,をサポートしていないと言い、むしろPipelineModelがトレーニングセットを伴わなければならないと言います。