0 / 0
資料の 英語版 に戻る
MLOps と Trustworthy AI ユース・ケース
MLOps と Trustworthy AI ユース・ケース

MLOps と Trustworthy AI ユース・ケース

AI ライフサイクル全体でデータとモデル資産を管理するには、企業は統合されたシステムとプロセスを必要とします。 Cloud Pak for Data as a Service は、企業が実動で機械学習 (ML) モデルと AI モデルを開発、デプロイ、保守、および管理できるようにするためのプロセスとテクノロジーを提供します。

このビデオを視聴して、 Cloud Pak for Dataでソリューションを実装するためのデータ・ファブリックのユース・ケースを確認してください。

このビデオでは、本書に記載されている手順に従う代わりの方法として、視覚方式を提供します。

チャレンジ

企業向けの MLOps and trustworthy AI ソリューションを確立するには、以下の課題に取り組む必要があります。

データへのアクセス
組織は、データを使用して信頼できる AI アプリケーションと ML アプリケーションを構築するデータ・サイエンス・チームに、統合された管理対象データへの容易なアクセスを提供する必要があります。

モデルの運用可能化
組織は、モデルを作成してデプロイし、実稼働環境でモデルを採用するために、反復可能なプロセスを実装する必要があります。

モデルのガバナンスとコンプライアンスの確保
組織は、実動のモデルをモニターして、モデルが説明可能、有効、かつ正確であり、意図された目標からバイアスやドリフトを導入していないことを確認する必要があります。

Cloud Pak for Data as a Service上のデータ・ファブリックを使用して MLOps 自動ライフサイクルを実装することで、これらの課題を解決できます。


例: ゴールデン・バンクの課題

MLOps and trustworthy AI プロセスを実装し、オンライン・アプリケーションに低金利の住宅ローンの更新を提供することでビジネスを拡大するゴールデン・バンクのストーリーに従います。 ゴールデン・バンクのデータ・サイエンティストは、予期しないリスクを回避し、すべての応募者を公平に扱う住宅ローン承認モデルを作成する必要があります。

プロセス

企業に MLOps and trustworthy AI を実装するために、組織は以下のプロセスに従うことができます。

  1. データの共有
  2. モデルの作成とトレーニング
  3. モデルのデプロイ
  4. モニター・モデル
  5. モデルの追跡
  6. AI ライフサイクルの自動化

Cloud Pak for Data as a Service の Watson Studio、 Watson Machine Learning、 Watson OpenScale、および Watson Knowledge Catalog サービスは、組織が MLOps and trustworthy AI ソリューションを実装するために必要とするツールとプロセスを提供します。

MLOps と信頼できる AI のユース・ケースのフローを示す画像

1. データの共有

カタログは、データ・サイエンティスト・チームが必要な機能を備えた高品質のデータ資産を見つけることができるフィーチャー・ストアとして機能します。 カタログからプロジェクトにデータ資産を追加して、共同でデータの準備、分析、およびモデル化を行うことができます。

使用できるもの できること 最適な使用のタイミング
カタログ Watson Knowledge Catalog のカタログをフィーチャー・ストアとして使用して、組織内のコラボレーター間で共有する資産を編成します。

AI を活用したセマンティック検索と推奨を活用して、ユーザーが必要なものを見つけられるようにします。
ユーザーは、高品質のデータの理解、コラボレーション、エンリッチ、およびアクセスを容易に行う必要があります。

ビジネス・ユーザー間のデータとコラボレーションの可視性を高める必要があります。

ユーザーは、データの物理的な形式や場所を理解せずに、データを移動またはコピーせずに、データの表示、アクセス、操作、分析を行う必要があります。

ユーザーは、資産のレーティングおよびレビューによって資産を強化する必要があります。


例: ゴールデン・バンクのカタログ

ガバナンス・チーム・リーダーは、カタログ「住宅ローン承認カタログ」を作成し、データ・スチュワードとデータ・サイエンティストをカタログ・コラボレーターとして追加します。 データ・スチュワードは、作成したデータ資産をカタログに公開します。 データ・サイエンティストは、データ・スチュワードによってキュレートされたデータ資産をカタログ内で見つけ、それらの資産をプロジェクトにコピーします。 データ・サイエンティストは、プロジェクトでデータを精製して、モデルをトレーニングするための準備をすることができます。


2. モデルの作成とトレーニング

データに基づいて予測的な洞察を得るために、データ・サイエンティスト、ビジネス・アナリスト、および機械学習エンジニアは、モデルを作成してトレーニングすることができます。 データ・サイエンティストは、 Cloud Pak for Data as a Service サービスを使用して AI モデルを構築し、ビジネス問題の解決に役立つ予測を行うために適切なアルゴリズムと最適化が使用されるようにします。

使用できるもの できること 最適な使用のタイミング
AutoAI Watson Studio の AutoAI を使用して、アルゴリズムを自動的に選択し、機能を設計し、パイプライン候補を生成し、モデル・パイプライン候補をトレーニングします。

次に、ランク付けされたパイプラインを評価し、最良のものをモデルとして保存します。

トレーニングされたモデルをスペースにエクスポートするか、好みのモデル・トレーニング・パイプラインを AutoAI からノートブックにエクスポートして詳細化します。
適切なトレーニング・パイプラインとモデルのセットを素早く作成するための高度な自動化された方法が必要です。

生成されたパイプラインをエクスポートして、それらを詳細化できるようにする必要があります。
ノートブックおよびスクリプト Watson Studio でノートブックとスクリプトを使用して、プロジェクトで使用可能なトレーニング・データ・セット、またはデータベース、データレイク、オブジェクト・ストレージなどのデータ・ソースへの接続に基づいて、 Pythonまたは R で独自のフィーチャー・エンジニアリング・モデル・トレーニングと評価コードを作成します。

お気に入りのアルゴリズムとライブラリーを使用します。
Python または R のコーディング・スキルを使用して、モデルの作成、トレーニング、および評価に使用するコードを完全に制御できます。
SPSS Modeler のフロー Watson Studio で SPSS Modeler フローを使用して、プロジェクトで使用可能なトレーニング・データ・セット、またはデータベース、データレイク、オブジェクト・ストレージなどのデータ・ソースへの接続に基づいて、独自のモデル・トレーニング、評価、およびスコアリングのフローを作成します。 データを探索し、モデルのトレーニング、評価、およびスコアリングのフローを定義するための簡単な方法が必要です。
RStudio RStudio Server with R 3.6 開発環境で R を使用して作業することにより、データを分析し、モデルを作成してテストします。 R で作業するために開発環境を使用したいとします。
Decision Optimization Watson Machine Learningを使用して、データの準備、モデルのインポート、問題の解決、シナリオの比較、データの視覚化、ソリューションの検索、レポートの作成、デプロイするモデルの保存を行います。 処方的分析の問題に対する最適なソリューションを見つけるには、何百万もの可能性を評価する必要があります。
統合学習 分散データを使用して共通モデルをトレーニングします。 複数の場所に分散しているデータを移動、結合、または共有することなく、モデルをトレーニングする必要があります。


例: ゴールデン・バンクのモデル構築とトレーニング

ゴールデン・バンクのデータ・サイエンティストは、予期しないリスクを回避し、すべての応募者を公平に扱うモデル「住宅ローン承認モデル」を作成します。 最初からモデルの履歴とパフォーマンスを追跡して、「住宅ローン承認カタログ」にモデル・エントリーを追加したいと考えています。 彼らはノートブックを実行してモデルを構築し、どの申請者が住宅ローンの資格を満たしているかを予測します。 モデル・トレーニングの詳細は、モデル・エントリーのメタデータとして自動的に取り込まれます。


3. モデルのデプロイ

作成した AI モデルを運用チーム・メンバーがデプロイすると、それらの AI モデルはアプリケーションで使用可能になり、アクションの駆動を助けるスコアリングや予測に利用できるようになります。

使用できるもの できること 最適な使用のタイミング
スペースのユーザー・インターフェース (UI) Watson Machine Learning のスペース UI を使用して、モデルおよびその他の資産をプロジェクトからスペースにデプロイします。 UI を使用したい場合。
コマンド・ライン・ツール (cpdctl) Watson Machine Learning の cpdctl コマンド・ライン・ツールを使用して、モデルのライフサイクル (構成設定を含む) を管理し、モデルのトレーニング、モデルの保存、デプロイメント・スペースの作成、およびモデルのデプロイを含むエンドツーエンド・フローを自動化します。 コマンド・ラインからテスト環境または実稼働環境にモデルをデプロイして管理する必要がある。


例: ゴールデン・バンクのモデル・デプロイメント

ゴールデン・バンクのオペレーション・チーム・メンバーは、「住宅ローン承認モデル」をプロジェクトからデプロイメント・スペースにプロモートし、オンライン・モデル・デプロイメントを作成します。


4. デプロイ済みモデルのモニター

モデルをデプロイした後は、モデルが説明可能で透明性があるようにするために、それらのモデルを管理およびモニターすることが重要です。 データ・サイエンティストは、予測に暗黙的または明示的なバイアスが含まれているかどうかを判定できるように、モデルがどのようにして特定の予測に到達したかを説明できる必要があります。 また、モデルのライフサイクルを通して、モデルのパフォーマンスやデータ整合性の問題を監視することがベスト・プラクティスです。

使用できるもの できること 最適な使用のタイミング
Watson OpenScale 複数の特徴量にわたってモデルの公平性の問題をモニターします。

時間の経過に伴うモデルのパフォーマンスとデータの整合性をモニターします。

重み要因を使用して、モデルがどのように特定の予測に到達したかを説明します。

組織全体のモデルのガバナンスとライフサイクルを維持し、レポートします。
保護されている特徴量、または予測の公平性に寄与する可能性がある特徴量がある場合。

時間の経過とともにモデルのパフォーマンスとデータの整合性をトレースする必要があります。

モデルが特定の予測を提供する理由を把握する必要があります。


例: ゴールデン・バンクのモデル・モニタリング

ゴールデン・バンクのデータ・サイエンティストは、 Watson OpenScale を使用して、デプロイされた「住宅ローン承認モデル」をモニターし、それが正確であり、すべてのゴールデン・バンクの住宅ローン申請者を公平に扱うことを確認します。 ノートブックを実行してモデルのモニターをセットアップし、 Watson OpenScale ユーザー・インターフェースを使用して構成を微調整します。 データ・サイエンティストは、 Watson OpenScale 品質モニターおよび公平性モニターからの指標を使用して、モデルがどの程度効果を予測しているか、およびバイアスのある結果を生成しているかどうかを判別します。 また、住宅ローン申請者に意思決定を説明できるように、モデルがどのように意思決定に結びつくかについても理解します。


5. モデルの追跡

チームは、公平性と説明可能性についてモデルをモニターするだけでなく、実動モデルのパフォーマンスが良好であることを確認するために実動モデルを追跡する必要があります。

使用できるもの できること 最適な使用のタイミング
ファクトシート Watson Knowledge Catalogのカタログ内のモデル・インベントリーで、すべての登録済み資産のライフサイクル状況を表示し、モデル・エントリーに登録されているモデルまたはデプロイメントの詳細なファセット・シートまでドリルダウンします。

一般的なモデルの詳細、トレーニング情報とメトリック、および入力と出力のスキーマを表示します。

一般的なデプロイメントの詳細、評価の詳細、公平性の詳細、およびドリフトの詳細を表示します。
モデルが期待どおりに実行されていることを確認する必要があります。

調整を行う必要があるかどうかを判別する必要があります。


例: ゴールデン・バンクのモデル追跡

ゴールデン・バンクのビジネス・アナリストは、「住宅ローン承認モデル」を要求しています。 その後、データ・サイエンティストがモデルを構築してトレーニングし、ModelOps エンジニアがモデルをデプロイして評価する際に、AI ライフサイクルのすべてのステージを通してモデルを追跡できます。 ファセット・シートは、モデル履歴に関する詳細を文書化し、そのパフォーマンスを示すメトリックを生成します。


6. ML ライフサイクルの自動化

チームは、 Watson Studio パイプライン (ベータ) を使用して、MLOps と AI のライフサイクルを自動化および簡素化できます。

使用できるもの できること 最適な使用のタイミング
パイプライン (ベータ版) Watson Studio でパイプラインを使用して、ノートブック、 Data Refinery、および機械学習パイプラインを自動化する反復可能なスケジュール・フローを、データ取り込みからモデル・トレーニング、テスト、およびデプロイメントまで作成します。 MLOps フローの一部またはすべてのステップを自動化する必要があります。


例: ゴールデン・バンクの自動 ML ライフサイクル

ゴールデン・バンクのデータ・サイエンティストは、パイプラインを使用して MLOps and trustworthy AI のライフサイクルとプロセス全体を自動化し、住宅ローンの承認プロセスを簡素化することもできます。


MLOps and trustworthy AI のチュートリアル

チュートリアル 説明 チュートリアルの専門知識
モデルをビルドとデプロイする モデルをトレーニングし、デプロイメント・スペースにプロモートし、モデルをデプロイします。 ノートブックを実行します。
モデルのテストおよび検証 正確度、公平性、および説明可能性についてモデルを評価します。 ノートブックを実行し、ユーザー・インターフェースで結果を表示します。

もっと見る

親トピック: データ・ファブリック・ソリューションの概要