モデル評価に関するよくある質問への回答をご覧いただけます。
一般
データ・トレーニングの質問
リスク、バイアス、公平性、および説明可能性
- 機械学習モデルの使用に伴うさまざまな種類のリスクにはどのようなものがありますか?
- Watson OpenScale を使用することで、モデル・バイアスはどのように緩和されますか?
- 人種や性別などのセンシティブな属性に対してモデルがトレーニングされていない場合でも、そのモデルのバイアスを検査できますか?
- API を使用してモデルの公平性を構成できますか?
- Watson OpenScale では、どのような種類の説明が示されますか?
- Watson OpenScale の what-if 分析は、どのようなものですか?
- Watson OpenScale では、どのモデルに対してローカル/LIME の説明がサポートされていますか?
- Watson OpenScale では、どのモデルに対して対比的説明および what-if 分析がサポートされていますか?
- Watson OpenScale の説明性構成の制御可能な特徴量とは何ですか?
ドリフト
- IBM Watson OpenScale では、どのような種類のドリフトが検出されますか?
- Watson OpenScale は、正確度のドリフトとデータのドリフトを検出しますか?
- モデル正確度ドリフトまたはデータ・ドリフトに注目する必要があるのはなぜですか?
- 正解率の低下、つまりモデル正解率ドリフトは IBM Watson OpenScaleでどのように計算されますか?
- IBM Watson OpenScale では、データ整合性の低下はどのように計算されますか?
- Watson OpenScale では、テキスト・コーパスでトレーニングされたモデルのドリフトは検出できますか?
- Watson OpenScale では、イメージ・データでトレーニングされたモデルのドリフトは検出できますか?
- Watson OpenScale、'IBM'watsonx.aiランタイムにデプロイされた'Python関数のドリフトを検出できますか?
その他
- Watson OpenScaleを使用する実動前環境では、モデルのリスクが評価され、使用が承認された後、実稼働環境ですべてのモニターを再構成する必要がありますか?
- Watson OpenScale では、実動前のモデル・デプロイメントをベンチマーク・モデルと比較して、どれくらいよいか悪いか確認できますか?
- Watson OpenScale では、品質指標の計算にどのようなデータが使用されますか?
- Watson OpenScale では、なぜ一部の構成タブが使用不可になっているのですか?
Watson OpenScale を自分のサーバーで実行するには、どのくらいのコンピューター処理能力が必要ですか?
3 ノード構成および 6 ノード構成については、固有のハードウェア構成ガイドラインがあります。 具体的な構成のサイズ設定について、IBM の技術販売チームから支援を受けることもできます。 Watson OpenScaleはIBM Cloud Pak for Data のアドオンとして動作するため、両方のソフトウェア製品の要件を考慮する必要があります。
Watson OpenScale にトレーニング・データへのアクセス権限が必要なのはなぜですか?
Db2 または IBM Cloud Object Storage に格納されているトレーニング・データへのアクセス権限を Watson OpenScale に付与するか、またはトレーニング・データにアクセスするためのノートブックを実行する必要があります。
以下の理由で、Watson OpenScale は訓練データにアクセスする必要があります。
- ローカル解釈可能モデルに依存しない説明 (LIME) および対比的説明を生成するには、説明を作成するために、トレーニング・データからの中央値、標準偏差、および個別値などの統計へのアクセスが必要です。
- 訓練データの統計を表示するため。 バイアスの詳細ページにデータを取り込むために、Watson OpenScale は統計を生成する基になる訓練データを必要とします。
- ドリフト検出モデルを作成するため。つまり、ドリフト・モニターは、訓練データを使用してドリフト検出を行い、調整します。
ノートブック・ベースの方法では、Watson OpenScale でデプロイメントを構成する際に統計およびその他の情報をアップロードすることが求められます。 Watson OpenScale は、ご使用の環境で実行されているノートブック以外でトレーニング・データにアクセスできなくなりました。 構成中にアップロードされた情報にのみアクセスできます。
使用するコマンド・ライン・ツールはありますか?
そのとおりです! ModelOps CLI ツールがあります。正式名称は Watson OpenScale CLI モデル操作ツールです。 これを使用して、機械学習モデルのライフサイクル管理に関連するタスクを実行します。
Watson OpenScale ではどのバージョンの Python を使用できますか?
Watson OpenScale はモデル作成プロセスとは独立しているため、機械学習プロバイダーがサポートしているどの Python バージョンでもサポートします。 Watson OpenScale Python クライアントは、IBM Cloud で Watson OpenScale サービスを直接操作できる Python ライブラリーです。 最新のバージョン情報については、『Requirements』セクションを参照してください。 Watson OpenScale クライアント UI ではなく Python クライアントを使用すると、ロギング・データベースの構成、機械学習エンジンのバインド、デプロイメントの選択とモニターを直接行うことができます。 この方法で Python クライアントを使用する例については、Watson OpenScale サンプル・ノートブックを参照してください。
Watson OpenScaleを実行するために使用できるブラウザーはどれですか?
Watson OpenScale サービス・ツールでは、IBM Cloud で必要とされるレベルと同じレベルのブラウザー・ソフトウェアが必要です。 詳しくは、 IBM Cloud 前提条件 のトピックを参照してください。
モデルの構成にはトレーニング・データの場所に関する情報が必要であり、オプションとして Cloud Object Storage と Db2 があります。 データが Netezza 内にある場合、Watson OpenScale で Netezza を使用できますか?
この Watson OpenScale ノートブック を使用して、 Netezza からデータを読み取り、トレーニング統計とドリフト検出モデルを生成します。
モデルに対して行われた更新が Watson OpenScale に表示されないのはなぜでしょうか?
Watson OpenScale は、モデル自体ではなく、モデルのデプロイメントに対して動作します。 新しいデプロイメントを作成した後、Watson OpenScale でその新しいデプロイメントを新規サブスクリプションとして構成することが必要です。 このような仕組みにすると、モデルの 2 つのバージョンを比較できます。
Watson OpenScale を使用すると、モデルのバイアスはどのように緩和されますか?
Watson OpenScale のバイアス緩和機能はエンタープライズ・グレードです。 これは堅固でスケーラブルであり、さまざまな種類のモデルに対応できます。 Watson OpenScale でのバイアス緩和は、2 ステップのプロセスで構成されます。
- 学習フェーズ: 顧客モデルの行動を学習して、バイアスのある方法で行動するタイミングを理解します。
- アプリケーション・フェーズ: お客様のモデルが特定のデータ・ポイントでバイアス挙動を示すかどうかを特定し、必要に応じてバイアスを修正します。 詳しくは、 バイアス緩和済みトランザクションの確認を参照してください。
人種や性別など、センシティブな属性に対するモデルのバイアスについて、モデルがそれらについてトレーニングされていない場合でもチェックできますか?
はい。 最近 Watson OpenScale は、「間接的バイアス検出」と呼ばれる画期的な機能を発表しました。 これを使用することで、モデルがセンシティブな属性についてトレーニングされていない場合でも、それらの属性に対して間接的にバイアスを示しているかどうかを検出します。 詳しくは、 バイアス緩和済みトランザクションの確認を参照してください。
API を使用してモデルの公平性を構成できますか?
はい、Watson OpenScale SDK を使用して実行できます。 詳しくは、 IBM Watson OpenScale Python SDK 資料を参照してください。
機械学習モデルの使用に伴うさまざまな種類のリスクにはどのようなものがありますか?
入力データの変更 (ドリフトとも呼ばれる) など、機械学習モデルに関連する複数の種類のリスクにより、モデルが不正確な意思決定を行い、ビジネス予測に影響を与える可能性があります。 トレーニング・データをクリーンアップしてバイアスを除去することはできますが、ランタイム・データがモデルのバイアスのある動作を引き起こす可能性があります。
従来の統計モデルは解釈と説明がより簡単ですが、機械学習モデルの結果を説明できず、モデルの使用に対して深刻な脅威をもたらす可能性があります。
Watson OpenScale では正確度のドリフトとデータのドリフトが検出されますか?
Watson OpenScale は、正確度のドリフトとデータのドリフトの両方を検出します。
- 正確度のドリフトは、実行時のモデル正確度の低下を推定します。 モデルがトレーニング・データで正しく評価しなかったトランザクションに類似したトランザクションが増加すると、モデル正確度が低下します。 このタイプのドリフトは、構造化された 2 項分類モデルと多項分類モデルについてのみ計算されます。
- データのドリフトは、トレーニング時のデータの特性と比較して、実行時のデータの整合性の低下を推定します。
Watson OpenScale に表示される説明のタイプはどのようなものですか?
Watson OpenScale では、LIME、対比的説明、および SHAP の説明に基づいてローカルで説明します。 詳しくは、 説明性の表示を参照してください。
Watson OpenScale の what-if 分析とは何ですか?
説明 UI には、what-if シナリオをテストする機能も用意されています。 例えば、ユーザーは、入力データ・ポイントの特徴量値を変更して、モデルの予測と確率に対する影響を確認できます。
どのモデルが LIME の説明をサポートしていますか?
以下のタイプのモデルは、 Watson OpenScaleで LIME の説明をサポートします。
- 構造化回帰および分類モデル
- 非構造化テキストおよびイメージ分類モデル
対比的説明および what-if 分析をサポートするモデルはどれですか?
対比的説明および what-if 分析は、構造化データおよび分類問題を使用するモデルに対してのみサポートされます。
Watson OpenScale の説明性の構成で制御可能な特徴量は何ですか?
制御可能な特徴量を使用する場合に、入力データ・ポイントの一部の特徴量をロックして、対比的説明が生成されるときにそれらが変更されないようにすることができます。さらに、what if 分析でもそれらを変更できません。 変更してはならない特徴量は、説明可能性構成で制御不能または NO に設定する必要があります。
自分のモデルが想定どおり動作することを確認するために、Watson OpenScale ダッシュボードのモニターを続ける必要がありますか?
いいえ。 Watson OpenScaleで実動モデル・デプロイメントの E メール・アラートをセットアップできます。 リスク評価テストが失敗するたびに E メール・アラートが送信されます。その後、問題を確認して対処することができます。
モデルのリスクが評価され、使用が承認された後に Watson OpenScale を使用する実動前環境では、実稼働環境ですべてのモニターを再構成する必要がありますか?
いいえ。Watson OpenScale では、実動前サブスクリプションの構成を実動サブスクリプションにコピーする手段が用意されています。 詳しくは、 モデル・リスクの管理を参照してください。
Watson OpenScale で、実動前の自分のモデル・デプロイメントをベンチマーク・モデルと比較して、その良し悪しの程度を確認できますか?
はい。 Watson OpenScale には、2 つのモデル・デプロイメントまたはサブスクリプションを比較するオプションが用意されています。 構成されている各モニターで、2 つのモデルの動作を横並びで比較することができます。 比較するには、 Watson OpenScale ダッシュボードのモデル・サマリー・ページに移動し、 Actions -> Compare
を選択します。 詳しくは、 評価結果の確認を参照してください。
Watson OpenScale では、品質指標の計算にどのようなデータが使用されますか?
品質指標は、手動でラベル付けされたフィードバック・データと、そのデータに関するモニター対象デプロイメントの応答を使用して計算されます。
Watson OpenScale では、なぜ一部の構成タブが使用不可になっているのですか?
一部の条件によって、特定のタブが使用可能になります。 タブの円のアイコンの上にマウスを移動すると、そのタブが使用不可になっている理由が表示されます。
モデル正確度のドリフトやデータのドリフトが問題である理由は何ですか?
モデル正確度またはデータ整合性の低下は、そのモデルに関連するビジネス結果への悪影響につながり、モデルを再訓練することによって対処する必要があります。
IBM Watson OpenScale によって検出される各種のドリフトはどのようなものですか?
Watson OpenScale では、モデル正確度のドリフトとデータのドリフトの両方が検出されます。
Watson OpenScale では正確度の低下 (つまりモデル正確度のドリフト) はどのように計算されますか?
Watson OpenScale は、プロキシー・モデル (ドリフト検出モデルとも呼ばれます) を作成してモデルの動作を学習します。 トレーニング・データと、トレーニング・データでモデルによって予測が作成される方法が確認されます。
詳しくは、ドリフト検出を参照してください。
IBM Watson OpenScale ではデータ整合性の低下はどのように計算されますか?
IBM Watson OpenScale は、構成時に、トレーニング・データ上の 1 列および 2 列の制約または境界を学習します。 その後に、すべてのペイロード・トランザクションを分析して、どのトランザクションがデータ整合性の低下の原因になっているかを判断します。 詳しくは、 ドリフト・メトリックを参照してください。
Watson OpenScale で、テキスト・コーパスでトレーニングされたモデルのドリフトを検出できますか?
現時点では、Watson OpenScale はテキスト・ベース・モデルのドリフトを検出できません。
Watson OpenScale で、画像データでトレーニングされたモデルのドリフトを検出できますか?
現時点では、Watson OpenScale は画像ベース・モデルのドリフトを検出できません。
IBM watsonx.aiRuntime にデプロイしたPython関数のドリフトをWatson OpenScale検出できますか?
Watson OpenScale は、構造化データ・セットでトレーニングされた Python 関数のドリフトを検出できます。 テキスト・データ・セットまたはイメージ・データ・セットでトレーニングされた Python 関数はサポートされていません。 Python 関数のスコアリング出力には、分類問題のすべてのクラス確率を含む予測列と確率列を含める必要があります。
親トピック: Watson OpenScale