翻訳が最新ではありません
利用可能な基盤モデルのリストを取得し、そのリストを便利な方法でフィルタリングします。
開発方法
これらのプログラミング方法を使用することで、利用可能な基盤モデルに関する情報を取得できます
あるいは、製品UIのリソースハブで利用可能な基盤モデルを確認し、フィルタリングすることもできます。 詳しくは、以下のリソースを参照してください。
REST API
You can use the 利用可能な基盤モデルをリストアップする method of the watsonx.ai API to get information about the available foundation models.
返されるモデル情報には、コードからモデルを参照するために必要なモデルIDが含まれています。
利用可能な基盤モデルをリストアップする
The 利用可能な基盤モデルをリストアップする method in the watsonx.ai API gets information about the foundation models that are deployed by IBM in watsonx.ai and are available for inferencing immediately.
curl -X GET \
'https://{region}.ml.cloud.ibm.com/ml/v1/foundation_model_specs?version=2024-05-01'
モデルIDを取得したら、コード内でモデルIDを参照することができます
curl --request POST 'https://{cluster_url}/ml/v1/text/generation?version=2023-05-02'
-H 'Authorization: Bearer eyJhbGciOiJSUzUxM...'
-H 'Content-Type: application/json'
-H 'Accept: application/json'
--data-raw '{
"model_id": "google/flan-t5-xxl",
"input": "Tell me a story",
"project_id": "63dc4cf1-252f-424b-b52d-5cdd9814987f"
}'
基盤モデルをリストアップする
アクセス可能な基盤モデルの一覧を取得するには、次の方法を使用します。 この方法では、無記名トークンが必要です。
curl -X GET \
'https://{region}.ml.cloud.ibm.com/ml/v4/deployments?version=2024-12-12&type=custom_foundation_model'
オンデマンドデプロイモデルをリストアップする
To get a list of IBM-provided foundation models that you can deploy yourself, use the following method:
curl -X GET \
'https://{region}.ml.cloud.ibm.com/ml/v1/foundation_model_specs?version=2024-12-10&filters=curated'
Use the returned Model ID to deploy the deploy on demand foundation model to a deployment space. モデルをデプロイした後、 デプロイメントの APIエンドポイントを使用してモデルを推論することができます。
提供基盤モデルを推論するためのモデルIDの検索
提供されている基盤モデルのモデルIDを確認するには、以下のリンクをクリックしてください
オンデマンド基盤モデルに展開するためのモデルID
watsonx.ai REST API から、 Create a deployment メソッドを使用してfoundation modelをデプロイし、 Deployments > Infer text メソッドを使用してデプロイされたfoundation modelモデルを推論することができます。
詳細については、 REST APIを使用してオンデマンドでデプロイされた基盤モデルのデプロイと管理を参照してください。
以下のリストは、APIからデプロイオンデマンドfoundation modelをデプロイする際に、 {model_id}
パラメーターで使用する値を示しています。
granite-3-8b-base
ibm/granite-3-8b-base-curated
granite-13b-chat-v2
ibm/granite-13b-chat-v2-curated
granite-13b-instruct-v2
ibm/granite-13b-instruct-v2-curated
granite-20b-code-base-schema-linking
ibm/granite-20b-code-base-schema-linking-curated
granite-20b-code-base-sql-gen
ibm/granite-20b-code-base-sql-gen-curated
flan-t5-xl-3b
google/flan-t5-xl-curated
flan-t5-xxl-11b
google/flan-t5-xxl-curated
flan-ul2-20b
google/flan-ul2-curated
llama-2-13b-chat
meta-llama/llama-2-13b-chat-curated
llama-2-70b-chat
meta-llama/llama-2-70b-chat-curated
llama-3-8b-instruct
meta-llama/llama-3-8b-instruct-curated
llama-3-70b-instruct
meta-llama/llama-3-70b-instruct-curated
llama-3-1-8b
meta-llama/llama-3-1-8b-curated
llama-3-1-8b-instruct
meta-llama/llama-3-1-8b-instruct-curated
llama-3-3-70b-instruct
meta-llama/llama-3-3-70b-instruct-curated
llama-3-3-70b-instruct-hf
meta-llama/llama-3-3-70b-instruct-hf-curated
mixtral-8x7b-base
mistralai/mixtral-8x7b-base-curated
mixtral-8x7b-instruct-v01
mistralai/mixtral-8x7b-instruct-v01-curated
mistral-nemo-instruct-2407
mistralai/mistral-nemo-instruct-2407-curated
mt0-xxl-13b
bigscience/mt0-xxl-curated
親トピック: 生成 AI ソリューションのコーディング