AI ガバナンス・チュートリアル: モデルのテストおよび検証
このチュートリアルを使って、「モデルの構築と展開」チュートリアルで構築・展開したモデルを、AI ガバナンスのユースケースで評価・監視します。 目標は、 Watson OpenScale を使用して、住宅ローンの対象となる申込者を予測するデプロイ済みモデルのモニターを構成および評価することです。 モデルが正確であり、すべての応募者を公平に扱っていることを確認する必要があります。
このチュートリアルのストーリーは、ゴールデン・バンクがオンライン・アプリケーションに低金利のモーゲージ更新を提供することでビジネスを拡大しようとしているというものです。オンライン・アプリケーションは、銀行の顧客範囲を拡大し、銀行のアプリケーション処理コストを削減します。 ゴールデン・バンクのデータ・サイエンティストは、予期しないリスクを回避し、すべての応募者を公平に扱う住宅ローン承認モデルを作成する必要があります。 Jupyter ノートブックを実行して、機械学習モデルのモニターをセットアップします。 このタスクは、Cloud Pak for Data サービスによって達成されます。これらのサービスは、データの信頼、モデルの信頼、そして AI を確実に運用するために必要なプロセスの信頼を提供します。
以下のアニメーション・イメージは、チュートリアルの終わりまでに達成する内容のクイック・プレビューを提供します。 イメージをクリックすると、より大きなイメージが表示されます。
チュートリアルをプレビューする
このチュートリアルでは、以下のタスクを実行します:
- 前提条件をセットアップします。
- タスク 1: ノートブックを実行してモニターをセットアップします。
- タスク 2: モデルを評価します。
- タスク 3: モデル・モニターの品質を監視する。
- タスク 4: モデル・モニターの公平性を監視します。
- タスク 5: 説明性についてモデル・モニターを監視します。
- タスク 6: モデルを実動前にプロモートし、モデルを承認します。
- クリーンアップ (オプション)
このチュートリアルのステップをプレビューするには、このビデオをご覧ください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
このチュートリアルを完了するためのヒント
このチュートリアルを正常に完了するためのヒントを以下に示します。
ビデオ・ピクチャー・イン・ピクチャーの使用
以下のアニメーション・イメージは、ビデオ・ピクチャー・イン・ピクチャーおよび目次機能の使用方法を示しています。
コミュニティーでのヘルプの利用
このチュートリアルでヘルプが必要な場合は、Cloud Pak for DataCommunityディスカッションフォーラムで質問したり、回答を見つけることができます。
ブラウザー・ウィンドウのセットアップ
このチュートリアルを最適に実行するには、1 つのブラウザー・ウィンドウで Cloud Pak for Data を開き、このチュートリアル・ページを別のブラウザー・ウィンドウで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。 2 つのブラウザー・ウィンドウを横並びに配置して、見やすくすることを検討してください。
前提条件のセットアップ
モデルのビルドとデプロイ のチュートリアルを完了します。
このタスクをプレビューするには、 00:47から始まるビデオをご覧ください。
モデルのビルドとデプロイ のチュートリアルを完了して、このチュートリアルで使用する機械学習モデルを作成、プロモート、およびデプロイします。
サービスのプロビジョン
このタスクをプレビューするには、 01:14から始まるビデオをご覧ください。
モデルの構築とデプロイのチュートリアルを完了するために必要なサービスに加えて、 Watson OpenScale サービスもプロビジョンされている必要があります。 必要なサービスを検証またはプロビジョンするには、以下の手順を実行します。
Cloud Pak for Dataで、ダラス・リージョンにいることを確認します。 そうでない場合は、地域のドロップダウンをクリックし、ダラスを選択します。
「ナビゲーションメニュー「」から、「サービス」>「サービスインスタンス」を選択する。
サービスのリストを表示して、 watsonx.governance または Watson OpenScale サービス・インスタンスが存在するかどうかを判別します。
watsonx.governance サービス・インスタンスを作成する必要がある場合は、 「サービスの追加」をクリックします。
watsonx.governanceを選択します。 watsonx.governance には Watson OpenScaleが含まれていることに注意してください。
地域として 「ダラス」を選択します。
「ライト」 プランを選択します。
「作成」 をクリックします。
モデルのビルドおよびデプロイのチュートリアルには、以下の追加サービスが必要でした。
- watsonx.aiスタジオ
- watsonx.aiランタイム
- IBM Knowledge Catalog
- Cloud Object Storage
進捗状況を確認する
以下のイメージは、プロビジョンされたサービス・インスタンスを示しています。 これで、このチュートリアルを開始する準備ができました。
タスク 1: ノートブックを実行してモニターをセットアップする
このタスクをプレビューするには、01:55から始まるビデオをご覧ください。
サンプル・プロジェクトに含まれている 2 番目のノートブックを実行して、以下を行います。
- モデルとデプロイメントを取り出します。
- Watson OpenScaleを構成します。
- 機械学習サービスのサービス・プロバイダーとサブスクリプションを作成します。
- 品質モニターを構成します。
- 公平性モニターを構成します。
- 説明性を構成します。
サンプル・プロジェクトに含まれているノートブックを実行するには、以下のステップを実行します。 このノートブックは、モデルのモニターをセットアップします。これは、ユーザー・インターフェースを使用して構成することもできます。 ただし、ノートブックを使用してセットアップするほうが、手っ取り早く、ミスも少ないです。 しばらく時間をかけて、各セルのコードを説明するノートブックのコメントを読みます。
ナビゲーションメニュー「」から「Projects」 > 「View all projects」を選択します。
「AI ガバナンス」 プロジェクトを開きます。
注: このユース・ケースに含まれているチュートリアルを示すガイド・ツアーが表示される場合があります。 ガイド・ツアーのリンクから、これらのチュートリアルの説明が開きます。Assets」タブをクリックし、「Notebooks」に移動します。
'2-monitor-wml-model-with-watson-openscale ノートブックを開きます。
ノートブックが読み取り専用モードになっているので、編集アイコン「」をクリックして、ノートブックを編集モードにします。
リソース・ハブからプロジェクトをインポートした場合、このノートブックの最初のセルには、プロジェクト・アクセス・トークンが含まれています。 このノートブックにプロジェクト・アクセス・トークンを持つ最初のセルが含まれていない場合、トークンを生成するには、 「詳細」 メニューから 「プロジェクト・トークンの挿入」を選択します。 このアクションにより、プロジェクト・トークンを含むノートブックの最初のセルとして新しいセルが挿入されます。
「 IBM Cloud API キーの挿入」 セクションで、 ibmcloud_api_key フィールドに API キーを貼り付けます。
ノートブックのすべてのセルを実行するには、 「セル」>「すべて実行」 をクリックします。 あるいは、各セルとその出力を探索する場合は、セルごとにノートブック・セルを実行できます。
ノートブックが完了するまでに 1 分から 3 分かかります。 進行状況セルをモニターするには、アスタリスク「In [
*
]」を数値 (例えば、「In [1
]」) に変更することにより、進行状況セルを表示します。ノートブックの実行中にエラーが発生した場合は、以下のトラブルシューティングのヒントを試してください。
「カーネル」>「再始動」&「出力のクリア」 をクリックしてカーネルを再始動してから、ノートブックを再実行します。
既存の Watson OpenScale デプロイメントを削除し、新規サービス・インスタンスを プロビジョン します。
チュートリアルの「モデルのビルドと配置」で、AIのユースケース、配置スペース、および配置名を作成したことを、指定されたアーティファクト名を先頭または末尾にスペースを入れずに正確にコピー&ペーストして確認します。
進捗状況を確認する
以下のイメージは、実行が完了したときのノートブックを示しています。 ノートブックによってモデルのモニターがセットアップされるため、 Watson OpenScaleでデプロイメントを表示できるようになりました。
タスク 2: モデルの評価
このタスクをプレビューするには、03:40から始まるビデオをご覧ください。
以下の手順に従ってホールドアウト・データをダウンロードし、そのデータを使用して Watson OpenScaleでモデルを評価します。
ナビゲーショントレイルでAIガバナンスプロジェクトをクリックします。
'「アセット」 タブで、 「データ」>「データ・アセット」をクリックします。
GoldenBank_HoldoutData.csvデータ資産のオーバーフローメニュー「クリックし、「ダウンロード」を選択します。 モデルが必要に応じて機能していることを検証するには、モデルのトレーニングから除外された一連のラベル付きデータが必要です。 この CSV ファイルには、そのホールドアウト・データが含まれています。
Watson OpenScale を起動します。 ナビゲーションメニュー「」から、「サービス」>「サービスインスタンス」を選択する。
Watson OpenScale インスタンスを開きます。 プロンプトが出されたら、 Cloud Pak for Dataの登録に使用したのと同じ資格情報を使用してログインします。
Watson OpenScale サービス・インスタンス・ページで、 「 Watson OpenScaleをクリックします。
洞察ダッシュボードで、 Mortgage Approval Model Deployment タイルをクリックしてください。
アクション メニューから、 今すぐ評価を選択してください。
インポート・オプションのリストから、 CSV ファイルからを選択してください。
プロジェクトからダウンロードした Golden Bank_HoldoutData.csv データ・ファイルをサイド・パネルにドラッグします。
アップロードして評価をクリックしてください。
進捗状況を確認する
以下の図は、 Watson OpenScaleでのデプロイされたモデルの評価結果を示しています。 これで、モデルを評価したので、モデルの品質を監視する準備ができました。
タスク 3: モデル・モニターの品質の監視
このタスクをプレビューするには、 04:44から始まるビデオをご覧ください。
Watson OpenScale 品質モニターは、モデルの品質を評価するための一連のメトリックを生成します。 これらの品質メトリックを使用して、モデルの予測結果の精度を判別できます。 ホールドアウト・データを使用する評価が完了したら、以下の手順に従ってモデルの品質または正確度を確認します。
左のナビゲーションパネルで、インサイトダッシュボードのアイコン「」をクリックする。
Mortgage Approval Model Deployment タイルを見つけます。 デプロイメントには問題がなく、 「品質」 テストと 「公平性」 テストの両方が合格したこと、つまりモデルが必要なしきい値を満たしていることに注意してください。
「Mortgage Approval Model Deployment」 タイルをクリックすると、詳細が表示されます。
品質セクションで、設定アイコン「」をクリックする。 ここでは、このモニターに対して構成されている品質しきい値が 70% であること、および使用されている品質の測定値が ROC 曲線の下の領域であることが分かります。
「モデル要約に移動」 をクリックして、モデルの詳細画面に戻ります。
品質セクションで、詳細アイコン」をクリックすると、モデル品質の詳細結果が表示されます。 ここには、いくつかの品質メトリック計算と、正しいモデル決定と誤検出および検出漏れを示す混同行列が表示されます。 ROC 曲線の下の計算領域は 0.9 以上であり、これは 0.7 しきい値を超えているため、モデルは品質要件を満たしています。
ナビゲーション・トレールで 「住宅ローン承認モデルのデプロイメント」 をクリックして、モデルの詳細画面に戻ります。
進捗状況を確認する
以下の画像は、 Watson OpenScaleの品質の詳細を示しています。 モデルの品質を確認したので、モデルの公平性を確認できます。
タスク 4: 公平性についてのモデル・モニターの監視
このタスクをプレビューするには、06:01から始まるビデオをご覧ください。
Watson OpenScale 公平性モニターは、モデルの公平性を評価するための一連の指標を生成します。 公平性メトリックを使用して、モデルがバイアスのある結果を生成するかどうかを判別できます。 モデルの公平性を確認するには、以下の手順を実行します。
公平性セクションで、設定アイコン「」をクリックする。 ここでは、性別に関係なく応募者が公平に扱われていることを確認するために、モデルがレビューされていることがわかります。女性は、公平性が測定されているモニター対象グループとして識別され、公平性のしきい値は少なくとも 80% になります。公平性モニターは、公平性を判別するために異なる影響方式を使用します。 差別的影響は、モニター対象グループの好ましい結果の割合を、参照グループの好ましい結果の割合と比較します。
「モデル要約に移動」 をクリックして、モデルの詳細画面に戻ります。
公平性セクションで、詳細アイコン「」をクリックすると、モデルの公平性の詳細結果が表示される。 ここには、自動的に承認される男性と女性の応募者の割合と、100% を超える公平性スコアが表示されます。そのため、モデルのパフォーマンスは、必要な 80% の公平性しきい値をはるかに超えています。
示されているデータ・セットをメモしてください。 公平性指標が最も正確であることを確実にするために、 Watson OpenScale は摂動を使用して、保護された属性と関連するモデル入力のみが変更され、他の特徴量は変更されていない結果を判別します。摂動により、特徴量の値が参照グループからモニター対象グループに (またはその逆に) 変更されます。 これらの追加のガードレールは、「平衡型」データ・セットが使用されている場合に公平性を計算するために使用されますが、ペイロードまたはモデルのトレーニング・データのみを使用して公平性の結果を表示することもできます。モデルは公正に動作しているため、このメトリックの詳細を追加する必要はありません。
「Mortgage Approval Model Deployment」 ナビゲーション・トレールをクリックして、モデルの詳細画面に戻ります。
進捗状況を確認する
以下の画像は、 Watson OpenScaleでの公平性の詳細を示しています。 これで、モデルの公平性が確認されたので、モデルの説明可能性を確認できます。
タスク 5: 説明可能性についてのモデル・モニターの監視
このタスクをプレビューするには、07:42から始まるビデオをご覧ください。
また、モデルがどのように決定されたかを理解することも重要です。 この理解は、ローン承認に関係する人に意思決定を説明し、その意思決定が有効であることをモデル所有者に保証するために必要です。 これらの決定を理解するには、以下のステップに従って、モデルの説明可能性を確認します。
左のナビゲーション・パネルで、'Explain a transaction' アイコン ' をクリックする。
トランザクションのリストを表示するには、 「住宅ローン承認モデルのデプロイメント」 を選択します。
任意のトランザクションについて、 アクション 列の下の 説明 をクリックしてください。 ここに、この決定の詳細な説明が表示されます。モデルへの最も重要な入力と、最終結果に対する各入力の重要度が表示されます。 青い棒はモデルの決定をサポートする傾向のある入力を表し、赤い棒は別の決定につながった可能性のある入力を示します。 例えば、申請者が承認されるのに十分な収入を持っているが、それらの申請者の信用履歴と高い負債が一緒になって、申請を拒否するモデルが作成されているとします。この説明を検討して、モデルの決定の基礎について満足するようにしてください。
(オプション) モデルがどのように決定したかについてさらに詳しく知りたい場合は、 「検査」 タブをクリックします。 「検査」 機能を使用して、少数の入力に対する小さな変更によって異なる決定が行われる可能性がある感度の領域を判別するために意思決定を分析します。また、実際の入力の一部を代替値でオーバーライドして、それらが結果に影響するかどうかを確認することで感度をテストできます。
進捗状況を確認する
以下の画像は、 Watson OpenScaleでのトランザクションの説明性を示しています。 モデルが正確であり、すべての応募者を公平に扱うと判断しました。 これで、モデルをそのライフサイクルの次のフェーズに進めることができます。
タスク 6: モデルを実動前にプロモートし、モデルを承認する
このタスクをプレビューするには、09:21から始まるビデオをご覧ください。
以下のステップに従って、モデル・インベントリー内の AI ユース・ケースのステータスを変更し、モデルを承認します。
Cloud Pak for Dataに戻り、ナビゲーションメニュー「」から「Catalogs > AI use cases」を選択する。
住宅ローン承認モデルのユースケースを開きます。
「ライフサイクル」 タブをクリックして、モデルが現在 「検証」 ステージにあることを確認します。
Statusの横にある編集アイコン「」をクリックし、Validation completeを選択してUpdateをクリックする。
Watson OpenScale 洞察ダッシュボードに戻ります。
Mortgage Approval Model Deployment タイルクリックしてください。
アクション メニューから、 実動の承認を選択してから、 承認をクリックしてください。 このアクションは、AI 運用チームに、指定された実動スペースにモデルをデプロイできるようになったことを伝えます。
ナビゲーションメニュー「」から、「カタログ」>「AIユースケース」を選択する。
「住宅ローン承認モデルのユース・ケース (Mortgage Approval model use case)」で、 「詳細の表示」をクリックします。
「ライフサイクル」 タブをクリックします。 「モデル・トラッキング」で、AI ユース・ケースが 「検証」 ステージで評価および承認済みとして表示されるようになりました。
Mortgage Approval Model Deployment を表示して、 Watson OpenScaleによってキャプチャーされたファセット・シートを確認します。
モデル・デプロイメント・ファセットを閉じます。
進捗状況を確認する
以下の図は、検証フェーズでのモデルを使用した AI ユース・ケースを示しています。 これで、モデルは実動状態になりました。
進捗状況を確認する
次の画像は、 Mortgage Approval Model Use Caseの完全なレポートを示しています。 これで、このレポートを同僚と共有できるようになりました。
ゴールデン・バンクのデータ・サイエンティストとして、予期しないリスクを回避し、すべての応募者を公平に扱う住宅ローン承認モデルを作成しました。 あなたはJupyterノートブックを実行し、機械学習モデルのモニターをセットアップしました。
クリーンアップ (オプション)
AI ガバナンス・ユース・ケースのチュートリアルを再利用する場合は、以下の成果物を削除します。
成果物 | 削除方法 |
---|---|
ゴールデン・バンクの生産前スペースにおける住宅ローン承認モデルの展開 | デプロイメントの削除 |
ゴールデン・バンク・プレプロダクション・スペース | デプロイメント・スペースの削除 |
住宅ローン承認モデルのユース・ケース | モデルのユースケースを削除する |
住宅ローン承認カタログ | カタログの削除 |
AI ガバナンス・サンプル・プロジェクト | プロジェクトの削除 |
次のステップ
別の ユース・ケースに登録します。
詳しくは、 モデルの作成、デプロイ、および信頼のチュートリアルを参照してください。
AutoAIを使用してモデルを作成します。
Industry Acceleratorsのエンドツーエンドのサンプルを探索します。
もっと見る
IBM OpenPagesを使用して、モデルのライフサイクル操作を通じてモデルを管理する方法をご覧ください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
親トピック: ユース・ケースのチュートリアル