AIエージェントによるタスクの自動化
エージェント型AIは、人間の監視を最小限に抑えた自律的な意思決定とタスク実行を重視する人工知能の新たな進化である。
従来のAIやジェネレーティブAIは通常、人間によるプロンプトを必要としたり、コンテンツ作成に重点を置いたりする。 しかし、エージェント型AIシステム( AIエージェントとも呼ばれる)は、以下のようなタスクをこなすように設計されている:
- 自主的に意思決定を行う
- アクション実行
- 複雑な問題を解決する
- 外部環境との相互作用
このようなシステムは、反応的というよりむしろ積極的であり、目標を追求し、複数のステップからなるタスクを計画し、常に人間が入力しなくてもリアルタイムの変化に適応することができる。
機能
タスクを自動化し、アプリケーションをより柔軟でダイナミックなものにするために、AIエージェントを構築して配備することができる。 エージェント型アプリケーションは、 基盤モデルモデルがユーザーとのインタラクションの流れを制御するエージェントとして機能することを可能にする。
実際のワークフローでは、エージェント内の基盤モデルモデルは、エンドユーザによって提出されたプロンプトに基づいて、1つまたは複数の外部ツールまたはカスタムツールを選択します。 モデルは次に、 ツールコール ( 関数コールとも呼ばれる)と呼ばれるプロセスを使用して、1つまたは複数のツールを使用して入力を処理し、応答を生成する。
例えば、レストラン予約アプリは以下の情報を収集し、予約を作成する必要があるかもしれない:
- 場所
- ゲスト数
- 日付と時刻
情報を収集する順番が重要なのは、1テーブルに入れるゲストの数が限られている場所や、天気の良い日には外の席の方が多く利用できるような場所に限られるかもしれない。 エージェントが予約リクエストを完了する前に、サードパーティの天気予報アプリなどの追加ツールを呼び出すタイミングをエージェントに判断させることができます。
エンドユーザーに代わって意思決定を行い、タスクを実行するようにエージェントを構成することができます。 エージェントとエンドユーザー間のインタラクションのパラメータを定義します。 エージェントは、現在のインタラクションの状態に基づいて、次の最適なステップを決定するためにパラメータを使用する。
エージェントアプリケーションを構築する際には、以下のコアコンポーネントを設定する必要があります:
- 基盤モデル
エージェント型ワークフローを構築する際には、以下の要件を満たす基盤モデルモデルを選択する:
- チャットタスクの処理
- ツール・コールをサポート
- 思考の連鎖を促すテクニックによく反応し、次の行動を選択する
- 推論ベンチマークで好成績
エージェントラボで使用できる基盤モデルリストについては、 エージェントラボの設定オプションを参照してください。 watsonx.ai でツール呼び出しをサポートする基盤モデルプログラムでリストアップするには、 エージェント駆動型チャットを参照してください。
- フレームワーク
エージェントの作成、展開、管理に使用するAIエージェントフレームワークを選択します。 エージェントラボでエージェントを構築するために LangGraph フレームワークのみを使用できます。 ローカルでエージェントを構築し、 watsonx.ai でエージェントをデプロイすることを選択した場合、様々な代替フレームワークを使用することができます。
- アーキテクチャー
エージェントAI推論を実装するアーキテクチャを選択します。 ReAct (Reason + Act) テクニックだけでエージェントを作ることができます。 ReAct 各ステップの結果が次のステップに反映されるという、推論と行動の連続的なループを生み出す。
- 説明
基盤モデルシステムプロンプトで使用されるエージェントの具体的な指示を指定します。 この指示には、 基盤モデル知識ベースの代わりに、特定の言語、日付や時刻のフォーマット、ユーザーの挨拶、または外部ツールを情報源として使用することが含まれる。 効果的なプロンプトの作り方については、 プロンプトのヒントをご覧ください。
- ツール
基盤モデルモデルに提出されたプロンプトの根拠となる追加情報を取得できる外部ツールを指定する。 以下の種類のツールからお選びください:
- watsonx.ai ですぐに使えるツールを提供。
- 特殊な入力形式を処理するために作成し、特殊な結果を生成するカスタムツール。 カスタムツールの作成と使用方法については、以下の例を参照してください:
- UIからエージェントラボでカスタムツールを作成する
- APIから: ツール呼び出しAPIリクエストの例。
働き方
以下のグラフィカルツールを使用して、以下のエージェントを構築することができます。 watsonx.ai:
- エージェントラボ watsonx.ai UI から一度に1つのエージェントを構築するためのグラフィカルツールです。
以下のプログラムメソッドを使用できます:
- watsonx.ai チャット API を、エージェント主導のチャットワークフローを構築するために、ツール呼び出しをサポートする基盤モデル使用します。 詳細については、 エージェント駆動型チャットの構築を参照してください。
- watsonx.ai にエージェントをデプロイする前に、ローカルでエージェントを開発しテストしてください。 詳細は Developer Hub ドキュメントの Agents を参照。
サンプル
次の表は、以下の環境で展開可能なエージェントの構築方法を示すサンプルです。 watsonx.ai:
例 | フォーマット | 説明 | リンク |
---|---|---|---|
完全なエージェントを内蔵 watsonx.ai | エージェント | 基盤モデル知識ベースと外部ツールを使用して、利用可能な食材のリストに基づいてレシピのアイデアを生成するサンプルエージェント。 | スーシェフ・サンプルエージェント |
様々なフレームワークを使用するエージェント | Python | エージェントを展開する前に、ローカルでエージェントを開発しテストするために使用できるサンプルエージェントテンプレートです。 テンプレートには、 watsonx.ai で AI サービスとしてデプロイされるエージェントをセットアップするために必要なコードが含まれています。 詳しくは、 テンプレートを使ったAIサービスのコーディングとデプロイを参照。 | 対応エージェントテンプレート |
詳細情報
親トピック AIソリューション