IBM Watson Machine Learningを使用して、機械学習モデル、スクリプト、関数、および生成 AI モデルのプロンプト・テンプレートをデプロイできます。 デプロイメントを作成した後、それらをテストおよび管理し、実動前環境および実稼働環境にデプロイするための資産を準備して、予測と洞察を生成することができます。
サービス 管理者は、 watsonx プラットフォームで Watson Machine Learning サービスをプロビジョンして、その機能を使用できるようにする必要があります。
デプロイメント・スペースでの資産のデプロイおよび管理
利害関係者とコラボレーションするためのデプロイメント・スペースを作成し、AI 資産をデプロイして管理します。 デプロイメント・スペース内の資産を管理するには、プロジェクトからデプロイメント・スペースに資産をプロモートする必要があります。 デプロイメント・スペースから資産をインポートまたはエクスポートすることもできます。 詳しくは、Deployment spaces を参照してください。
以下の図は、AI 資産をデプロイするための標準的なアクティビティーを示しています。
資産をデプロイする方法
以下の方法で、資産をデプロイおよび管理できます。
非コード・アプローチの使用: 非コード・アプローチを使用して、デプロイメント・スペースで資産をデプロイおよび管理することができます。 詳しくは、 デプロイメント・スペースでの資産のデプロイおよび管理 を参照してください。
カスタム・コード・アプローチの使用 カスタム・コード・アプローチを使用すると、以下を使用して資産をプログラマチックにデプロイおよび管理することができます。
追加の watsonx API については、 watsonx APIsを参照してください。
デプロイメントのタイプ
組織のニーズに応じて、オンライン・デプロイメントまたはバッチ・デプロイメントを作成できます。
オンライン・デプロイメント: 入力データをリアルタイムで処理するためのオンライン・デプロイメントを作成します。 オンライン・デプロイメントをリアルタイムでテストするために、新規顧客データをデプロイメント・エンドポイントに送信して、リアルタイムで予測を取得することができます。 フォームまたは JSON コードを使用してテスト・データを入力することにより、オンライン・デプロイメントをテストできます。 詳しくは、 Watson Machine Learningでのオンライン・デプロイメントの作成を参照してください。
バッチ・デプロイメント: データ・ソースからの大量の入力データを処理し、選択した宛先に出力を書き込むバッチ・デプロイメントを作成します。 バッチ・デプロイメントをテストするには、バッチ・デプロイメント・ジョブを作成する必要があります。 バッチ・デプロイメント・ジョブを構成するには、入力データ、出力ファイル、およびスケジュールまたはオンデマンドでのジョブの実行に関する情報に関する詳細を指定します。 詳しくは、 Watson Machine Learningでのバッチ・デプロイメントの作成を参照してください。
アプリケーション・デプロイメント: アプリケーション・デプロイメントを作成して、R Shiny アプリケーションなどのアプリケーション資産をデプロイします。 詳しくは、 Watson Machine Learningを参照してください。
デプロイメント・エンドポイントの取得
デプロイされたアセットを予測用アプリケーションで使用するには、オンラインまたはバッチ デプロイのエンドポイント URL を取得します。 モデル・エンドポイントは、モデル・デプロイメントを起動および管理するためのインターフェースへのアクセスを提供します。
詳しくは、 オンライン・デプロイメントのエンドポイントの取得 または バッチ・デプロイメントのエンドポイントの取得を参照してください。
デプロイ可能な資産のタイプ
特定の資産は、オンライン・デプロイメントまたはバッチ・デプロイメントの作成にのみ使用できます。 例えば、オンライン・デプロイメントとバッチ・デプロイメントの両方で、 Python 関数、スクリプト、およびモデル ( AutoAI モデルや Decision Optimization モデルなど) などの資産のデプロイメントがサポートされます。 ただし、オンライン・デプロイメントは、ファイルからインポートされたモデルに対してのみ作成できます。 デプロイ可能な資産のさまざまなタイプは、以下のとおりです。
- ファウンデーション・モデル資産: watsonx.aiを使用して、チューニングされたモデルやプロンプト・テンプレート資産などのファウンデーション・モデル資産をデプロイできます。 詳しくは、 ファウンデーション・モデル資産のデプロイを参照してください。
- Machine Learning 資産: Watson Machine Learningを使用して、 Python 関数、R Shiny アプリケーション、NLP モデル、スクリプトなどの機械学習 Machine Learning 資産をデプロイできます。 詳しくは、 Machine Learning 資産のデプロイを参照してください。
- Decision Optimization モデル: Watson Machine Learningを使用して、 Decision Optimization モデルをデプロイできます。
デプロイメントの管理
デプロイメント・スペース内のデプロイメントのアクセス、更新、スケーリング、削除、およびパフォーマンスのモニターを行うことができます。
- デプロイメントへのアクセス: デプロイメント・スペースが実動前用か実動用かを記述するステージ・タイプなど、デプロイメントに関連する詳細にアクセスできます。
- デプロイメントの更新: デプロイメントの詳細 (デプロイメント名、ソフトウェア仕様など) を更新できます。 詳しくは、 デプロイメントの更新を参照してください。
- デプロイメントのスケーリング: デプロイメントの複数のコピーを作成して、大量の評価要求に対するスケーラビリティーと可用性を向上させることができます。 詳しくは、 デプロイメントのスケーリングを参照してください。
- デプロイメントの削除: リソースを解放するために不要になったデプロイメントを削除します。 詳しくは、 デプロイメントの削除を参照してください。
- デプロイメント・パフォーマンスのモニター: Watson OpenScale インスタンスをプロビジョンし、公平性、品質、ドリフト、および説明性のモニターを構成することで、デプロイメントを評価してパフォーマンスを測定し、モデル予測を理解することができます。
デプロイメント・アクティビティーのモニター
デプロイメント・ダッシュボードを使用して、デプロイメントの集約ビューを取得し、デプロイメント・アクティビティーをモニターします。 このダッシュボードを使用して、ジョブの作成時に定義したジョブ・スケジュールに基づいて、バッチ・デプロイメント・ジョブ (アクティブな実行や終了した実行など) の状況をモニターできます。 成功したオンライン・デプロイメントと失敗したオンライン・デプロイメントの数に関する情報を取得することもできます。 詳しくは、 デプロイメント・ダッシュボードを参照してください。
デプロイメントのためのランタイム環境の管理
ランタイム環境は、デプロイメントを実行するために必要な機能を提供します。
ユース・ケースに応じて、事前定義されたランタイム環境を使用することも、カスタム・ランタイム環境を作成してさらに多くのコンポーネントを組み込むこともできます。 デプロイメント用のカスタム・ランタイム環境を作成するには、Dockerfile を作成し、基本イメージを追加する必要があります。 さらに、 docker
コマンドを追加して、デプロイメントのランタイム環境をビルドすることもできます。 詳しくは、 Watson Machine Learning デプロイメント・ランタイムのカスタマイズを参照してください。
デプロイメントのフレームワークおよびソフトウェア仕様の管理
ソフトウェア仕様およびフレームワークには、対応するバージョンのパッケージを含むパッケージのバンドルが含まれています。
ユース・ケースに応じて、事前定義されたソフトウェア仕様を使用することも、カスタム・ソフトウェア仕様を作成することもできます。 例えば、既存のフレームワークに新規パッケージを追加したり、新規パッケージを作成したり、ソフトウェア仕様からパッケージ・バージョンを置換したりすることができます。
サービスを継続するには、非推奨になった後にモデルのソフトウェア仕様を最新バージョンに更新する必要があります。 フレームワークが非推奨になると、このフレームワークのサポートは将来のリリースで除去されます。
詳しくは、 Watson Machine Learningのフレームワークとソフトウェア仕様を参照してください。
詳細情報
親トピック: AI 資産のデプロイおよび管理