Obtener información sobre modelos de base
Obtenga una lista de los modelos de base desplegados en watsonx.ai y filtre la lista de forma útil.
Formas de desarrollarse
Puede obtener información sobre los modelos de bases disponibles utilizando estos métodos de programación:
También puede ver la lista de modelos de bases y filtrarlos desde el centro de recursos en la interfaz de usuario de watsonx.ai. Para obtener más información, consulte los siguientes recursos:
API REST
Puede utilizar el método List the available foundation models (Enumerar los modelos de base de maquillaje disponibles ) de la API de watsonx.ai para obtener información sobre los modelos de base de maquillaje disponibles.
La información del modelo que se devuelve incluye el ID del modelo, que necesita para hacer referencia al modelo desde su código.
Enumera los modelos de base disponibles
El método List the available foundation models (Enumerar los modelos de base disponibles ) en la API de watsonx.ai obtiene información sobre los modelos de base que IBM implementa en watsonx.ai y que usted puede inferir inmediatamente.
curl -X GET \
'https://{region}.ml.cloud.ibm.com/ml/v1/foundation_model_specs?version=2024-05-01'
Después de obtener el ID del modelo, puede hacer referencia al ID del modelo en su código de la siguiente manera:
curl --request POST 'https://{cluster_url}/ml/v1/text/generation?version=2023-05-02'
-H 'Authorization: Bearer eyJhbGciOiJSUzUxM...'
-H 'Content-Type: application/json'
-H 'Accept: application/json'
--data-raw '{
"model_id": "google/flan-t5-xxl",
"input": "Tell me a story",
"project_id": "63dc4cf1-252f-424b-b52d-5cdd9814987f"
}'
Enumere los modelos de bases de maquillaje personalizadas
Para obtener una lista de los modelos de bases personalizadas implementadas a las que puede acceder, utilice el siguiente método. Este método requiere un token al portador.
curl -X GET \
'https://{region}.ml.cloud.ibm.com/ml/v4/deployments?version=2024-12-12&type=custom_foundation_model'
Enumere los modelos de implementación bajo demanda
Para obtener una lista de los modelos de bases de datos proporcionados por IBM que puede implementar usted mismo, utilice el siguiente método:
curl -X GET \
'https://{region}.ml.cloud.ibm.com/ml/v1/foundation_model_specs?version=2024-12-10&filters=curated'
Utilice el ID de modelo devuelto para implementar el modelo de base de implementación bajo demanda en un espacio de implementación. Después de implementar el modelo, puede inferirlo utilizando el punto final de la API para su implementación.
Encontrar identificadores de modelos para inferir los modelos de base proporcionados
Para encontrar los ID de modelo de los modelos de base proporcionados, siga estos enlaces:
ID de modelo para modelos de cimientos desplegables bajo demanda
Desde la API REST de watsonx.ai, puede utilizar el método Crear una implementación para implementar el modelo base y, a continuación, utilizar el método Implementaciones > Inferir texto para inferir su modelo base implementado.
Para obtener más información, consulte Despliegue y gestión de modelos de la base desplegados a petición con la API REST.
La siguiente lista muestra los valores que se deben utilizar en el parámetro " {model_id}
" cuando se implementa un modelo de base de implementación bajo demanda desde la API.
granite-3-8b-base
ibm/granite-3-8b-base-curated
granite-7b-lab
ibm/granite-7b-lab-curated
granite-8b-japanese
ibm/granite-8b-japanese-curated
granite-20b-multilingual
ibm/granite-20b-multilingual-curated
granite-13b-chat-v2
ibm/granite-13b-chat-v2-curated
granite-13b-instruct-v2
ibm/granite-13b-instruct-v2-curated
granite-20b-code-base-schema-linking
ibm/granite-20b-code-base-schema-linking-curated
granite-20b-code-base-sql-gen
ibm/granite-20b-code-base-sql-gen-curated
allam-1-13b-instruct
ibm/allam-1-13b-instruct-curated
deepseek-r1-distill-llama-8b
deepseek-ai/deepseek-r1-distill-llama-8b-curated
deepseek-r1-distill-llama-70b
deepseek-ai/deepseek-r1-distill-llama-70b-curated
eurollm-1-7b-instruct
utter-project/eurollm-1-7b-instruct-curated
eurollm-9b-instruct
utter-project/eurollm-9b-instruct-curated
flan-t5-xl-3b
google/flan-t5-xl-curated
flan-t5-xxl-11b
google/flan-t5-xxl-curated
flan-ul2-20b
google/flan-ul2-curated
llama-2-13b-chat
meta-llama/llama-2-13b-chat-curated
llama-2-70b-chat
meta-llama/llama-2-70b-chat-curated
llama-3-8b-instruct
meta-llama/llama-3-8b-instruct-curated
llama-3-70b-instruct
meta-llama/llama-3-70b-instruct-curated
llama-3-1-8b
meta-llama/llama-3-1-8b-curated
llama-3-1-8b-instruct
meta-llama/llama-3-1-8b-instruct-curated
llama-3-3-70b-instruct
meta-llama/llama-3-3-70b-instruct-curated
llama-3-3-70b-instruct-hf
meta-llama/llama-3-3-70b-instruct-hf-curated
mixtral-8x7b-base
mistralai/mixtral-8x7b-base-curated
mixtral-8x7b-instruct-v01
mistralai/mixtral-8x7b-instruct-v01-curated
mistral-nemo-instruct-2407
mistralai/mistral-nemo-instruct-2407-curated
mt0-xxl-13b
bigscience/mt0-xxl-curated
Tema principal: Codificación de soluciones generativas de IA