このチュートリアルでは、どの申込者に住宅ローンの資格があるかを予測するモデルを評価する方法を学びます。 品質、公平性、説明可能性についてモデルを評価しなければならない。
- 必須のサービス
- watsonx.ai
- watsonx.governance
基本的なワークフローには、以下のタスクが含まれます:
- プロジェクトを開きます。 プロジェクトでは、他の人と協力してデータやモデルを扱うことができます。
- モデルを作る。 これらの方法のいずれかを使ってモデルを作ることができる:
- Jupyterノートブックを作成し、Pythonコードを追加する。
- AutoAI実験を作成する。
- モデルをデプロイします。
- 以下のいずれかの方法で、Watson OpenScale モニタを設定します:
- Jupyter ノートブックを作成します。
- UI を使用して、Watson OpenScale ダッシュボードにデプロイメントを追加します。
Watson OpenScaleについて読む
Watson OpenScaleは、AI モデルから得られる結果を追跡・測定し、モデルがどこで構築され、実行されているかにかかわらず、公正で、説明可能で、コンプライアンスを維持できるようにします。 また、Watson OpenScale は、AI モデルを実稼働環境で使用する場合に、正確度のドリフトを検出して修正することができます。
機械学習モデルの評価に関するビデオを見る
このチュートリアルのステップをプレビューするには、このビデオをご覧ください。 ビデオで紹介されているユーザー・インターフェースには若干の違いがあるかもしれません。 このビデオは、書面でのチュートリアルに付随するものです。
このビデオは、このドキュメントのコンセプトとタスクを学ぶための視覚的な方法を提供します。
機械学習モデルの評価に関するチュートリアルを試す
このチュートリアルでは、以下のタスクを実行します:
- タスク1:サンプルプロジェクトの作成
- タスク2:モデルのデプロイ
- タスク3:ノートブックを実行してモニターをセットアップする
- タスク4:モデルの評価
- タスク5:モデルモニターの品質を観察する
- タスク6:公平性を保つためにモデルモニターを観察する
- タスク7:モデルモニターのドリフトを観察する
- タスク8:モデルのモニターを観察し、説明可能性を確認する
このチュートリアルを完了するためのヒント
このチュートリアルを成功させるためのヒントを紹介します。
ビデオのピクチャー・イン・ピクチャーを使う
次のアニメーション画像は、ビデオのピクチャー・イン・ピクチャーと目次機能の使い方を示しています:
地域の助けを借りる
このチュートリアルで助けが必要な場合は、watsonxコミュニティーのディスカッション・フォーラムで質問したり、答えを見つけることができます。
ブラウザのウィンドウを設定する
このチュートリアルを最適に完了するには、Cloud Pak for Data を 1 つのブラウザ ウィンドウで開き、このチュートリアルのページを別のブラウザ ウィンドウで開いておくと、2 つのアプリケーションを簡単に切り替えることができます。 2つのブラウザウィンドウを横に並べると、より見やすくなります。
タスク 1:サンプルプロジェクトの作成
このタスクをプレビューするには、00:06から始まるビデオを見てください。
このチュートリアルでは、機械学習モデルを含むサンプル・プロジェクトと、モニターを設定するためのノートブックを使用します。 以下の手順に従って、サンプルに基づいたプロジェクトを作成してください。
Resource hub のEvaluate an ML model sample projectにアクセスします。
プロジェクトを作成をクリックします。
プロジェクトを Cloud Object Storage インスタンスに関連付けるように求められたら、リストから Cloud Object Storage インスタンスを選択してください。
「作成」 をクリックします。
プロジェクトのインポートが完了するまで待ち、View new projectをクリックして、プロジェクトとアセットが正常に作成されたことを確認します。
アセットタブをクリックして、サンプルプロジェクトのアセットを表示します。
進捗状況を確認する
次の画像はサンプル・プロジェクトです。
これでチュートリアルを始める準備ができました
タスク2:モデルのデプロイ
モデルを配置する前に、モデルを新しい配置スペースにプロモートする必要があります。 デプロイメントスペースでは、入力データや環境などのサポートリソースを整理したり、モデルや関数をデプロイして予測やソリューションを生成したり、デプロイの詳細を表示または編集したりすることができます。
タスク 2a: モデルを配置スペースにプロモートする
このタスクをプレビューするには、00:49から始まるビデオを見てください。
以下の手順に従って、モデルを新しい配置スペースにプロモートしてください:
資産タブから、住宅ローン承認予測モデルをクリックしてモデルを表示します。
モデルページで、配置スペースへのプロモートのアイコン「」をクリックします。
ターゲット・スペースの場合は、 新規デプロイメント・スペースの作成を選択してください。
デプロイメントスペース名には、先頭や末尾にスペースを入れずに、表示されている通りの名前をコピーして貼り付けます:
Golden Bank Preproduction Space
リストからストレージ・サービスを選択します。
プロビジョニングされた機械学習サービスをリストから選択する。
「作成」 をクリックします。
閉じるをクリックします。
ターゲット・スペースの場合は、 ゴールデン・バンク・プレプロダクション・スペース が選択されていることを確認します。
プロモート後にスペース内のモデルに移動 オプションをチェックします。
プロモートをクリックします。
進捗状況を確認する
次の画像は、展開空間内のモデルを示している。 これで、モデルのデプロイメントを作成する準備が整いました。
タスク 2b: モデルのオンライン配置を作成する
このタスクをプレビューするには、 01:30から始まるビデオをご覧ください。
次の手順に従って、モデルのオンライン配置を作成します:
デプロイメント・スペースが開いたら、 新規デプロイメントをクリックしてください。
デプロイメント・タイプの場合は、 オンラインを選択してください。
名前には、先頭に空白や末尾にスペースを入れずに、表示されているとおりにデプロイメント名をコピーして貼り付けます:
Mortgage Approval Model Deployment
「作成」 をクリックします。
モデルの配置が完了するまで待ちます。 モデルが正常にデプロイされたら、デプロイメントを表示してスコアリングエンドポイントを確認し、オプションでモデルをテストします。
進捗状況を確認する
次の画像はモデルの配置を示している。
モニターを設定するためにノートブックを実行する準備ができました
タスク3:ノートブックを実行してモニターをセットアップする
このタスクをプレビューするには、01:55から始まるビデオをご覧ください。
サンプル・プロジェクトに含まれるノートブックを実行してください:
- モデルとデプロイメントを取得します。
- Watson OpenScale を設定します。
- 機械学習サービスのサービスプロバイダとサブスクリプションを作成します。
- 品質モニターを設定する。
- 公平性モニターを構成します。
- 説明性を構成します。
サンプル・プロジェクトに含まれているノートブックを実行するには、以下のステップを実行します。 このノートブックでは、お使いのモデルのモニターを設定し、ユーザーインターフェースからも設定できます。 ただし、ノートブックを使用してセットアップするほうが、手っ取り早く、ミスも少ないです。 各セルのコードを説明するノートのコメントに目を通してください。
ナビゲーションメニュー「」から、「プロジェクト」 > 「すべてのプロジェクトを表示」を選択します。
MLモデルを評価するプロジェクトを開きます。
Assets」タブをクリックし、「Notebooks」に移動します。
'注:ノートブックの横に注意アイコン が表示されている場合は、 モニターwml-model-with-watson-openscaleノートブックの横にあるオーバーフローメニュー をクリックし 、「環境の変更」 を選択します。 Pythonでサポートされているランタイムを選択し 、「変更」 をクリックします。
monitor-wml-model-with-watson-openscaleノートブックを開きます。
ノートブックは読み取り専用モードになっているので、 編集アイコン をクリックしてノートブックを編集モードにします。
リソース・ハブからプロジェクトをインポートすると、このノートブックの最初のセルにプロジェクトのアクセストークンが表示されます。 このノートブックにプロジェクト・アクセストークンを含む最初のセルがない場合、トークンを生成するには、その他メニューからプロジェクト・トークンを挿入を選択します。 このアクションは、プロジェクト・トークンを含むノートブックの最初のセルとして新しいセルを挿入します。
Provide yourIBM CloudAPI keyセクションでは、API キーを使用してwatsonx.aiRuntime API に認証情報を渡す必要があります。 保存された API キーがまだない場合は、以下の手順に従って API キーを作成します。
IBM Cloudコンソールの API キーのページにアクセスします。
「IBM Cloud API キーの作成」をクリックします。 既存のAPIキーがある場合、ボタンは作成と表示されます。
名前および説明を入力します。
「作成」 をクリックします。
API キーをコピーします 。
将来使用するために API キーをダウンロードします。
ノートブックに戻り、APIキーをibmcloud_api_key フィールドに貼り付けます。
の中で 3. Model and Deployment セクションで、space_name、model_name、deployment_name変数に割り当てられた値を確認します。
Cell > Run All をクリックして、ノートブックのすべてのセルを実行します。 あるいは、各セルの横にある実行アイコン をクリックして、ノートブックをセルごとに実行し、各セルとその出力を確認することもできます。
ノートは1~3分で完成する。 In [
*
]」というアスタリスクが、例えば「In [1
]」のように数字に変わることで、セルごとに進行状況をモニターできる。ノートブックの実行中にエラーが発生した場合は、以下のトラブルシューティングをお試しください:
Kernel > Restart & Clear Output をクリックしてカーネルを再起動し、ノートブックを再度実行します。
既存の Watson OpenScale デプロイメントをすべて削除し、新しいサービスインスタンスをプロビジョニングします。
指定されたアーティファクト名を先頭または末尾にスペースを入れずに正確にコ ピーして貼り付け、配置スペースと配置名を作成したことを確認します。
進捗状況を確認する
次の画像は、実行が完了したときのノートブックです。 ノートブックがモデルのモニターをセットアップしたので、Watson OpenScaleでデプロイメントを表示できるようになりました。
のようになります
タスク4:モデルの評価
このタスクをプレビューするには、 3分35秒から始まるビデオをご覧ください。
以下の手順に従ってホールドアウト・データをダウンロードし、そのデータを使って Watson OpenScale でモデルを評価します:
ナビゲーション・トレイルでMLモデルを評価するプロジェクトをクリックします。
資産タブで、データ > データ資産をクリックする。
オーバーフロー メニューをクリック GoldenBank_HoldoutData.csv データ アセットを選択し、 [ダウンロード] を選択します。 モデルが要求通りに動作していることを検証するには、モデルのトレーニングから取り出したラベル付きデータセットが必要である。 この CSV ファイルには、そのホールドアウト・データが含まれています。
Watson OpenScale を起動します。
ナビゲーションメニューから 、 [サービス] > [サービスインスタンス] の順に選択します。
Watson OpenScale インスタンスをクリックして、サービス・インスタンス・ページを開きます。 プロンプトが表示されたら、Cloud Pak for Data のサインアップに使用したのと同じ認証情報を使用してログインします。
注:インスタンスの名前は、`watsonx.governance-xx` のように異なるかもしれません。 Watson OpenScale サービス・インスタンス・ページで、Launch Watson OpenScale.
をクリックします
洞察ダッシュボードで、 Mortgage Approval Model Deployment タイルをクリックしてください。
アクション メニューから、 今すぐ評価を選択してください。
インポート・オプションのリストから、 CSV ファイルからを選択してください。
プロジェクトからダウンロードした Golden Bank_HoldoutData.csv データ・ファイルをサイド・パネルにドラッグします。
アップロードして評価するをクリックし、評価が完了するまで待ちます。
進捗状況を確認する
次の図は、Watson OpenScale にデプロイされたモデルの評価結果を示しています。 モデルを評価したところで、モデルの品質を観察する準備ができました。
タスク5:モデルモニターの品質を観察する
このタスクのプレビューを見るには、 4分40秒から始まるビデオをご覧ください。
Watson OpenScale 品質モニターは、モデルの品質を評価するための一連のメトリクスを生成します。 これらの品質メトリックを使用して、モデルの予測結果の精度を判別できます。 ホールドアウトデータを使用した評価が完了したら、以下の手順に従ってモデルの品質または精度を観察する:
品質セクションで、 設定アイコン をクリックします。 ここでは、このモニターに設定されている品質しきい値は70%であり、ROC曲線下の面積が品質測定に使用されていることがわかる。
Go to model summaryをクリックして、モデルの詳細画面に戻ります。
品質セクションで、モデル品質の詳細結果を見るには、 詳細アイコン をクリックします。 ここでは、多くの品質指標の計算と、正しいモデルの判断と偽陽性・偽陰性を示す混同行列を見ることができる。 計算されたROC曲線下面積は0.9以上であり、0.7のしきい値を超えているので、モデルは品質要件を満たしている。
ナビゲーショントレイルの住宅ローン承認モデルの展開をクリックして、モデルの詳細画面に戻ります。
進捗状況を確認する
次の画像は、Watson OpenScale での品質の詳細を示しています。 さて、モデルの品質を観察したところで、モデルの公平性を観察してみましょう。
です
タスク6:公平性を保つためにモデルモニターを観察する
このタスクをプレビューするには、 5分41秒から始まるビデオをご覧ください。
Watson OpenScale フェアネス・モニターは、モデルのフェアネスを評価するための一連のメトリクスを生成します。 公平性メトリックを使用して、モデルがバイアスのある結果を生成するかどうかを判別できます。 以下の手順に従って、モデルの公平性を観察してください:
「公平性」 セクションで 、「設定」アイコン をクリックします。 ここでは、性別に関係なく応募者が公平に扱われていることを確認するために、モデルがレビューされていることがわかります。 女性は、公平性が測定されているモニター対象グループとして識別され、公平性のしきい値は少なくとも 80% になります。 公平性モニターは、公平性を判別するために異なる影響方式を使用します。 差別的影響は、モニター対象グループの好ましい結果の割合を、参照グループの好ましい結果の割合と比較します。
Go to model summaryをクリックして、モデルの詳細画面に戻ります。
Fairness(公平性)セクションで 、Details(詳細)アイコン をクリックすると、モデルの公平性の詳細な結果が表示されます。 ここでは、自動的に承認される男女の申請者の割合と、100%を超える公平性スコアが示されている。
特定されたデータセットに注意。 公平性の測定基準が最も正確であることを保証するために、Watson OpenScale は摂動を使用し、保護された属性と関連するモデル入力のみが変更され、他の機能は変更されない結果を決定します。 摂動により、特徴量の値が参照グループからモニター対象グループに (またはその逆に) 変更されます。 これらの追加のガードレールは、「平衡型」データ・セットが使用されている場合に公平性を計算するために使用されますが、ペイロードまたはモデルのトレーニング・データのみを使用して公平性の結果を表示することもできます。 モデルは公正に動作しているため、このメトリックの詳細を追加する必要はありません。
Mortgage Approval Model Deployment ナビゲーショントレイルをクリックして、モデルの詳細画面に戻ります。
進捗状況を確認する
次の画像は、Watson OpenScale のフェアネス詳細を示しています。 モデルの公正さを観察できたので、モデルの説明可能性を観察できる。
タスク7:モデルモニターのドリフトを観察する
このタスクのプレビューを見るには、 7分25秒から始まるビデオをご覧ください。
Watson OpenScale ドリフトモニターは、データの経時変化を測定し、モデルの一貫した結果を保証します。 ドリフト評価を使用して、モデルの出力、予測の精度、入力データの分布の変化を確認します。 以下の手順に従って、モデルのドリフトを観察してください:
ドリフトセクションで、 設定アイコン をクリックします。 ここにドリフトのしきい値がある。 出力ドリフトは、モデルの信頼度分布の変化を測定する。 モデルの品質ドリフトは、推定された実行時精度とトレーニング精度を比較することで、精度の低下を測定する。 特徴ドリフトは、重要な特徴の値分布の変化を測定する。 設定には、選択された機能の数と最も重要な機能も表示されます。
Go to model summaryをクリックして、モデルの詳細画面に戻ります。
ドリフトセクションで、モデルドリフトの詳細結果を見るには、 詳細アイコン をクリックします。 時系列チャートで、各メトリックスコアの経年変化の履歴を見ることができます。 数値は低い方が良いので、この場合、結果はコンフィギュレーションで設定されている上限しきい値を超えている。 次に、スコア出力と特徴ドリフトの計算方法の詳細を表示します。 また、各機能の詳細を表示して、Watson OpenScale が生成するスコアにどのように貢献しているかを理解することもできます。
Mortgage Approval Model Deployment ナビゲーショントレイルをクリックして、モデルの詳細画面に戻ります。
進捗状況を確認する
次の図は、Watson OpenScale でのドリフトの詳細を示しています。 モデル・ドリフトを観察したので、モデルの説明可能性を観察することができます。
タスク8:モデルのモニターを観察し、説明可能性を確認する
このタスクのプレビューを見るには、 08:46 から始まるビデオをご覧ください。
また、モデルがどのようにしてその決定に至ったかを理解することも重要である。 この理解は、ローン承認に関わる人々に決定を説明するためにも、モデル・オーナーに決定が有効であることを保証するためにも必要である。 これらの決定を理解するために、以下の手順に従ってモデルの説明可能性を観察する:
左側のナビゲーションパネルで、 取引の説明アイコン をクリックします。
住宅ローン承認モデルの展開を選択すると、トランザクションの一覧が表示されます。
任意のトランザクションについて、 アクション 列の下の 説明 をクリックしてください。 ここに、この決定の詳細な説明が表示されます。 モデルへの最も重要な入力と、最終結果に対する各入力の重要度が表示されます。 青い棒はモデルの決定を支持する傾向のあるインプットを表し、赤い棒は別の決定につながったかもしれないインプットを表す。 たとえば、ある申込者は十分な収入があって審査に通るかもしれないが、クレジットヒストリーが乏しく、負債が多いために審査に通らないというケースだ。 この説明を検討して、モデルの決定の基礎について満足するようにしてください。
(オプション) モデルがどのように決定したかをさらに掘り下げたい場合は、Inspectタブをクリックします。 インスペクト 機能を使用して決定を分析し、いくつかの入力を少し変更しただけで異なる決定になるような感度の領域を見つけます。
進捗状況を確認する
次の図は、Watson OpenScale におけるトランザクションの説明可能性を示しています。 あなたは、このモデルが正確であり、すべての応募者を公平に扱っていると判断した。 Now, you can advance the model to the next phase in its lifecycle.
今後のステップ
モデルの評価についてより実践的な経験を積むために、以下の追加チュートリアルをお試しください:
その他のリソース
詳しくは、 ビデオを参照してください。
サンプルデータセット、プロジェクト、モデル、プロンプト、ノートブックをリソースハブで見つけて、実践的な経験を積むことができます:
プロジェクトに追加して、データの分析やモデルの構築を開始できるノートブック。
インポート可能なプロジェクトには、ノートブック、データセット、プロンプト、その他のアセットが含まれます。
プロジェクトに追加して、モデルの改良、分析、構築を行うためのデータセット。
プロンプト 。プロンプト・ラボで基盤モデルのプロンプトを出すために使用できます。
プロンプト・ラボで使用できる 基盤モデル 。
親トピック: クイック・スタート・チュートリアル