機械学習と生成 AI モデルのエンドツーエンドのモニターを提供する AI ガバナンス・ソリューションを使用して、 watsonx.governance を使用して、責任ある、透明性のある、説明可能な AI ワークフローを加速する方法を計画します。
AI ガバナンス機能は、導入環境によって異なります。
- Watsonx.governanceの上IBM Cloudほとんどの AI ガバナンス機能を提供します。 統合することができますIBMOpenPagesガバナンス コンソールを有効にするサービス。 すべてのソリューションが利用可能です (ライセンスが必要です)。
- Watsonx.governanceの上Amazon Web Services(AWS) は、ガバナンス コンソールにモデル リスク ガバナンス ソリューションを提供します。
ガバナンス機能
IBMによってキュレーションされたファウンデーション・モデルからメタデータを管理するには、 watsonx.ai がプロビジョンされている必要があります。
ガバナンス戦略を計画する際には、以下の watsonx.governance 機能を考慮してください。
- 機械学習モデルおよび生成 AI 基盤モデルのプロンプト・テンプレートに関するメタデータをファセット・シートで収集します。
- 公平性、ドリフト、および品質について機械学習のデプロイメントをモニターし、モデルが指定された標準を満たしていることを確認します。
- 生成 AI 資産を監視して、有害な言語のしきい値に違反したり、個人を特定できる情報を検出したりします。
- パフォーマンスを測定し、禁止されているコンテンツ (ヘイトフル・スピーチなど) が存在するかどうかをテストするように設計されたメトリックを使用して、プロンプト・テンプレートを評価します。
- データ・サイズ、待ち時間、スループットなどのモデルの正常性データを収集して、パフォーマンスの問題を評価し、リソース使用量を管理できるようにします。
- AI ソリューションの課題に対するガイドとして AI リスク・アトラス を使用することで、リスクの軽減を計画し、コンプライアンスと規制の目標を達成することができます。
- 追跡対象モデルに単一のリスク・スコアを割り当てて、関連付けられたモデルの相対的な影響を示します。 例えば、クレジット・スコアなどの機密情報を予測するモデルには、高リスク・スコアが割り当てられる場合があります。
- 自動化されたトランザクション分析ツールを使用して、AI 資産の透明性と説明性を向上させます。 例えば、特徴量がどのように予測に寄与しているかを確認し、what-if シナリオをテストして、さまざまな結果を探索します。
- オプションとして、IBM OpenPages Model Risk Governance と統合して、基礎モデルと機械学習モデルに関するメタデータを収集し、ガバナンス目標の達成を支援します。 また、 OpenPages を使用して、ガバナンス・プロセスをサポートするワークフローを開発することもできます。
ガバナンスの計画
以下のガバナンス戦略を検討してください。
ガバナンス・チームの構築
ガバナンス・チームに必要な専門知識を検討します。 標準的なガバナンス計画には、以下の役割が含まれる場合があります。 場合によっては、同じ個人が複数の役割を果たすことがあります。 また、ロールが人のチームを表す場合もあります。
- モデル所有者: 所有者は、ビジネス・ニーズに対するソリューションを追跡するための AI ユース・ケースを作成します。 所有者はモデルまたはプロンプト・テンプレートを要求し、承認プロセスを管理し、AI ライフサイクルを通じてソリューションを追跡します。
- モデル開発者またはデータ・サイエンティスト: 開発者は、データ・セットまたは大規模言語モデル (LLM) 内のデータを処理し、機械学習モデルまたは LLM プロンプト・テンプレートを作成します。
- モデル・バリデーター: バリデーターはソリューションをテストして、AI ユース・ケースに記述されている目標を満たしているかどうかを判別します。
- リスクおよびコンプライアンス・マネージャー: リスク・マネージャーは、AI ユース・ケースのポリシーおよびコンプライアンスしきい値を決定します。 例えば、リスク・マネージャーは、公平性についてソリューションをテストするために適用するルールを決定したり、憎悪に満ちた暴言のために出力をスクリーニングするために適用するルールを決定したりすることができます。
- MLOps エンジニア: MLOps エンジニアは、ソリューションを完全にデプロイする準備ができていると判断した場合に、ソリューションを実動前 (テスト) 環境から実稼働環境に移動します。
- アプリ開発者: デプロイメントをフォローし、アプリ開発者がデプロイメントに対して評価を実行して、リスクとコンプライアンスの所有者によって設定されたメトリックしきい値に対してソリューションがどのように実行されるかをモニターします。 パフォーマンスが指定されたしきい値を下回った場合、アプリ開発者は他の利害関係者と協力して問題に対処し、モデルまたはプロンプトテンプレートを更新する。
ガバナンス構造のセットアップ
役割を識別してチームを組み立てたら、ガバナンス構造を計画します。
- AI ユース・ケースを保管するためのインベントリーを作成します。 インベントリーとは、管理対象資産に関連付けられている AI ユース・ケースおよびファクト・シートを保管および表示する場所です。 ガバナンス要件に応じて、すべてのユース・ケースを単一のインベントリーに保管するか、ガバナンス作業のために複数のインベントリーを作成します。
- コラボレーションのためのプロジェクトを作成します。 IBMツールを使用している場合は、watsonx.aiStudio プロジェクトを作成します。 プロジェクトは、AI ソリューションのトレーニングまたはテストに必要なデータと、管理対象のモデルまたはプロンプト・テンプレートを保持できます。 アクセス制御を使用して、承認されたコラボレーターへのアクセスを制限します。
- 実動前デプロイメント・スペースを作成します。 スペースを使用して、テスト・データを使用してモデルまたはプロンプト・テンプレートをテストします。 プロジェクトと同様に、スペースはアクセス制御機能を提供するため、必要なコラボレーターを含めることができます。
- テストおよび検証の評価を構成します。 モデルまたはプロンプト・テンプレートの詳細を指定し、ソリューションのパフォーマンスをテストするための一連の評価を構成します。 例えば、公平性、品質、ドリフトなどのディメンションについて機械学習モデルをテストし、perplexity (出力の精度) や毒性 (出力に有害な音声や暴言が含まれているかどうか) などのメトリックに対してプロンプト・テンプレートをテストすることができます。 既知の (ラベル付けされた) データをテストすることにより、ソリューションを実稼働環境に移行する前にパフォーマンスを評価できます。
- 実動スペースを構成します。 モデルまたはプロンプト・テンプレートを実稼働環境にデプロイする準備ができたら、ソリューションとすべての依存関係を実稼働スペースに移動します。 実動スペースには通常、より厳密なアクセス制御リストがあります。
- デプロイされたモデルの評価を構成します。 モデルの詳細を指定し、ソリューションの評価を構成します。 テスト・データではなくライブ・データに対してテストできるようになりました。 しきい値を超えた場合にアラートが出され、デプロイされたソリューションに問題がある可能性があることが示されるように、ソリューションをモニターすることが重要です。
ガバナンスのためのコラボレーションの管理
Watsonx.governance は、承認されたすべてのチーム・メンバーがビジネスの問題解決の目標に貢献できるようにするためのコラボレーション・プラットフォーム上に構築されています。
コラボレーションを計画するには、ガバナンスに使用するインベントリー、プロジェクト、およびスペースへのアクセスを管理する方法を検討してください。
アクセス制御機能とともに役割を使用して、チームが目標を達成するための適切なアクセス権限を持つようにします。
コミュニケーション計画の策定
AI ユース・ケースの定義およびライフサイクルを通じたアセットの移動に関するワークフローの一部は、効果的なコミュニケーションに依存しています。 チームがどのようにコミュニケーションを取るかを決定し、詳細を設定します。 例:
- 意思決定に E メールを使用するか、Slack などのメッセージング・ツールを使用するか。
- 資産がワークフロー内を移動する際に、資産にコメントを追加する正式なプロセスはありますか?
コミュニケーション計画を作成し、チームと共有します。
シンプルなガバナンス・ソリューションの実装
ガバナンス戦略をロールアウトする際には、単純な実装から始めて、より包括的なソリューションを段階的に構築する方法を検討してください。 最も単純な実装には、要求から実動に移行する資産を含む、インベントリー内の AI ユース・ケースが必要です。
AI ガバナンスを最も簡単に実装するために、資産を追跡するための AI ユース・ケースを作成します。 インベントリにおけるAIのユースケースは、ファクトシートのセットで構成され、モデルのライフサイクルに関する系統、履歴、その他の関連情報を含んでいる。 データ・サイエンティスト、データ・エンジニア、およびその他のユーザーをコラボレーターとして追加します。
以下の図は、AI ユース・ケース所有者が資産を要求および追跡する方法を示しています。
- ビジネス・ユーザーは、インベントリー内に AI ユース・ケースを作成して、機械学習モデルまたは LLM プロンプト・テンプレートを要求します。
- データ・サイエンティストは、トレーニングされた資産を AI ユース・ケースに関連付けて、ライフサイクル・アクティビティーを追跡します。
AI ファセット・シートは、以下の方法でモデルまたはプロンプト・テンプレートに関する情報を集計します。
- 追跡対象資産に関連付けられているすべてのアクション (デプロイメントおよび評価を含む) が自動的に保存されます。
- 入力データ資産に対するすべての変更は自動的に保存されます。
- データ・サイエンティストは、タグ、サポート資料、およびその他の情報を追加できます。
- データ・サイエンティストは、チャレンジャー・モデルを AI ユース・ケースに関連付けて、モデルのパフォーマンスを比較できます。
バリデーターとその他の利害関係者は、AI のファセットをレビューして、コンプライアンスを確保し、開発から実動までの資産の進捗を認証します。 また、詳細を印刷、共有、またはアーカイブするために、ファセット・シートからレポートを生成することもできます。
より複雑なソリューションの計画
AI ガバナンスの実装はいつでも拡張できます。 ガバナンスを拡張するには、以下のオプションを検討してください。
- MLOps エンジニアは、モデル・トラッキングを拡張して、サード・パーティーの機械学習モデルを使用して作成された外部モデルを組み込むことができます。
- MLOps エンジニアは、詳細情報を追跡するために、カスタム・プロパティーをファクトシートに追加できます。
- コンプライアンス・アナリストは、組織の調整済みレポートを生成するために、デフォルトのレポート・テンプレートをカスタマイズできます。
- 統合するAI Factsheetsガバナンス コンソールを使用して、ガバナンス アクティビティのエンタープライズ ビューをサポートし、ガバナンス プロセスをサポートするワークフローを開発します。
ローカルまたは外部で作成された資産の管理
Watsonx.governanceは、AutoAIを使用して作成された機械学習モデルやwatsonxプロジェクトで作成されたfoundation modelなど、IBMツールを使用して作成された資産を管理するためのツールを提供します。 Microsoft Azure Amazon Web Servicesなど、IBM以外のツールを使用して作成された機械学習モデルを管理することもできる。 ガバナンス計画を作成する際には、以下の相違点を考慮してください。
- watsonx.aiStudioなどのツールで開発されたIBM資産は、ライフサイクルの早い段階でガバナンスに利用できる。 開発フェーズからローカル資産のファクト・シートを追跡し、前のステージからのトレーニング・データや作成の詳細などの詳細を可視化することができます。
- インベントリーの所有者または管理者は、外部モデルのガバナンスを有効にする必要があります。
- 外部モデルに対してガバナンスが有効になっている場合、それらのモデルを AI ユース・ケースに明示的に追加できます。 開発フェーズで外部モデルを追跡すると、検証フェーズと操作フェーズのライフサイクル・アクティビティーが自動的に追跡されます。
サポートされる機械学習モデル・プロバイダーのリストについては、 サポートされる機械学習プロバイダーを参照してください。
今後のステップ
ガバナンスを開始するには、「 watsonx.governanceの設定」の手順に従って、モデルの評価と追跡を開始する。
親トピック: Watsonx.governance の概要