AIサービスの展開
AIサービスは、ジェネレーティブAIのユースケースのロジックをキャプチャするために使用できる、デプロイ可能なコード単位である。 AIサービスが正常にデプロイされたら、アプリケーションからの推論にエンドポイントを使用できます。
AIサービスによる生成的AIアプリケーションの展開Copy link to section
Python関数は機械学習資産をデプロイする伝統的な方法だが、AIサービスはストリーミングのような生成的AIアプリケーションのコードをデプロイする、より柔軟なオプションを提供する。
予測機械学習モデルをデプロイするための標準的なPython関数とは異なり、固定スキーマでの入力を必要とするが、AIサービスは複数の入力に対する柔軟性を提供し、カスタマイズを可能にする。
AIサービスは、あなたのコード機能を展開するための安全なソリューションを提供します。 例えば、認証に必要なベアラートークンなどの認証情報は、サービスによってタスククレンデンシャルから生成され、トークンはAIサービスアセットで利用できるようになる。 このトークンを使用して、接続アセットを取得したり、データアセットをダウンロードしたりすることができます。
AIサービスを視覚的に展開Copy link to section
ユーザーインターフェースからノンコードアプローチに従うことで、AIサービスをデプロイメントスペース直接デプロイすることができます。 このアプローチを使用して、お客様のユースケースに合わせたオンラインまたはバッチデプロイメントを作成してください。
詳細については、「AIサービスの視覚的な展開 」を参照してください。
ツールを使用したAIサービスの展開Copy link to section
以下のビジュアルツールを使用して、ジェネレーティブAIソリューションを作成できます。 watsonx.ai:
- Prompt Lab
- AutoAI
- エージェント・ラボ
RAGのような複雑なユースケースに対応する生成型AIソリューションをビジュアルツールで作成すると、そのソリューションはAIサービスとして展開されます。 ユーザーインターフェースから直接ソリューションを展開するか、AIサービスを展開する Python で編集可能なノートブック形式でソリューションをエクスポートするかを選択できます。 このノートブックは、標準フォーマットでAIサービスを作成するためのコードを自動的に生成し、テスト後に機能の追加や更新を行う方法を提供します。 ツールは、ユーザーフレンドリーなインターフェースを提供してAIサービスの作成と展開を可能にしますが、コーディングはより柔軟性が高く、カスタマイズのオプションも豊富です。
詳細は 、「ツールを使用したAIサービスの展開 」を参照してください。
コードによるAIサービスの展開Copy link to section
ジェネレーティブAIアプリケーションを一から構築する場合、AIサービスを使用してアプリケーションのプログラミング・ロジックをキャプチャし、推論用のエンドポイントとともにデプロイすることができる。 例えば、LangChain, LlamaIndex,などのフレームワークを使ってRAGアプリケーションを構築する場合、AIサービスを使うことで、ベクトル・インデックスから答えを取り出すロジックをAIサービスに取り込み、AIサービスをデプロイすることができる。
詳細については、「コードを使用したAIサービスの展開 」を参照してください。
詳細情報Copy link to section
親トピック foundation model資産の展開