Modelos de cimientos compatibles con watsonx.ai

Última actualización: 04 abr 2025
Modelos de cimientos compatibles con watsonx.ai

Puede trabajar con modelos de terceros y de la fundación IBM en IBM watsonx.ai. Puede utilizar los modelos de base que proporciona IBM y que están listos para su uso inmediato, o implementar modelos de base bajo demanda para utilizarlos exclusivamente en su organización.

Cómo elegir un modelo

Para revisar los factores que pueden ayudarte a elegir un modelo, como las tareas e idiomas compatibles, consulta Elegir un modelo y Puntos de referencia del modelo Foundation.

Modelos de cimientos por método de despliegue

Dependiendo del método de implementación, puede utilizar modelos de base en hardware multiusuario directamente o implementar modelos en hardware dedicado para su uso por parte de su organización. Para obtener más información sobre las diversas formas en que puede utilizar para implementar modelos, consulte Métodos de implementación de modelos de Foundation.

Tabla 1. Modelos de cimientos por método de despliegue
Proveedor Proporcionado con watsonx.ai
(Pago por token)
Despliegue a la carta
(Pago por horas)
IBM - granite-13b-instruct-v2
- granite-8b-japanese (Deprecated)
- granite-3-8b-base
- granite-20b-multilingual (obsoleto)
- granite-3-2b-instruct
- granite-3-8b-instruct
- granite-3-2-8b-instruct
- granite-guardian-3-2b
- granite-guardian-3-8b
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
- granite-vision-3-2-2b
granite-7b-lab
granite-8b-japanese
granite-13b-chat-v2
granite-13b-instruct-v2
granite-20b-multilingual
granite-3b-code-instruct
granite-8b-code-instruct
granite-20b-code-instruct
granite-34b-code-instruct
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Google flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
Meta - llama-3-3-70b-instruct
- llama-3-2-1b-instruct
- llama-3-2-3b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct
- llama-guard-3-11b-vision-instruct
- llama-3-1-8b-instruct (Obsoleto)
- llama-3-1-70b-instruct (Obsoleto)
- llama-2-13b-chat (obsoleto)
- llama-3-3-70b-instruct
- llama-3-3-70b-instruct-hf
- llama-3-1-70b-instruye
- llama-2-13b-chat
- llama-2-70b-chat
- llama-3-8b-instruct
- llama-3-70b-instruct
- llama-3-1-8b
- llama-3-1-8b-instruct
Mistral AI mistral-large
mistral-small-24b-instruct-2501
mixtral-8x7b-instruct-v01
pixtral-12b
mistral-large-instruct-2407
mistral-large-instruct-2411
mistral-nemo-instruct-2407
mixtral-8x7b-base
mixtral-8x7b-instruct-v01
BigScience mt0-xxl-13b
Code Llama
DeepSeek IA deepseek-r1-distill-llama-8b
deepseek-r1-distill-llama-70b
ELYZA, Inc elyza-japanese-llama-2-7b-instruct
Inicio jais-13b-chat
SDAIA allam-1-13b-instruct allam-1-13b-instruct
Proyecto de Transcripción y Traducción Unificadas para la Realidad Ampliada (UTTER) - eurollm-1-7b-instr
- eurollm-9b-instruct

Modelos de base proporcionados que están listos para usar

Una colección de modelos de base de IBM y de código abierto se despliegan en IBM watsonx.ai. Puede solicitar estos modelos de cimentación en el Prompt Lab o mediante programación.

IBM modelos de base

En la siguiente tabla se enumeran los modelos de base IBM compatibles que IBM proporciona para la inferencia.

El uso se mide en unidades de recursos (UR); cada unidad equivale a 1000 fichas de la entrada y salida de la inferencia del modelo de la fundación. Para obtener más información sobre cómo se calcula y controla el precio de los modelos, consulte Detalles de facturación de los activos de IA generativa.

IBM También puede acceder a algunos modelos de bases de datos de terceros, como Hugging Face. IBM no indemnizará los modelos de IBM Foundation que usted obtenga de un repositorio de terceros. Sólo los modelos fundacionales IBM a los que acceda desde watsonx.ai están indemnizados por IBM. Para obtener más información sobre las protecciones contractuales relacionadas con la indemnización de IBM, consulte el Acuerdo de relación con el cliente IBM y la descripción del servicio IBM watsonx.ai.

Tabla 2a. IBM modelos de base provistos de un watsonx.ai o para inferencias
Nombre de modelo ID de modelo API Precio de
USD/1,000 fichas)
Precio de
USD/1,000 fichas)
Ventana contextual
(tokens de entrada + salida)
Más información
granite-13b-instruct-v2 ibm/granite-13b-instruct-v2 $0.0006 $0.0006 8.192 - Modelo de ficha
- Página web
- Documento de investigación
Nota : Este modelo de base puede ajustarse rápidamente.
granite-8b-japanese ibm/granite-8b-japanese $0.0006 $0.0006 4.096 - Ficha modelo
- Página web
- Documento de investigación
granite-20b-multilingual ibm/granite-20b-multilingual $0.0006 $0.0006 8.192 - Ficha modelo
- Página web
- Documento de investigación
granite-3-2b-instruct ibm/granite-3-2b-instruct $0.0001 $0.0001 131.072 - Ficha modelo
- Página web
- Documento de investigación
granite-3-8b-instruct ibm/granite-3-8b-instruct $0.0002 $0.0002 131.072 - Ficha modelo
- Página web
- Documento de investigación
granite-3-2-8b-instruct ibm/granite-3-2-8b-instruct $0.0002 $0.0002 131.072 - Ficha modelo
- Página web
- Documento de investigación
granite-guardian-3-2b ibm/granite-guardian-3-2b $0.0001 $0.0001 131.072 - Modelo de tarjeta
" - Página web
granite-guardian-3-8b ibm/granite-guardian-3-8b $0.0002 $0.0002 131.072 - Modelo de tarjeta
" - Página web
granite-3b-code-instruct ibm/granite-3b-code-instruct $0.0006 $0.0006 128.000 - Ficha modelo
- Página web
- Documento de investigación
granite-8b-code-instruct ibm/granite-8b-code-instruct $0.0006 $0.0006 128.000 - Ficha modelo
- Página web
- Documento de investigación
granite-20b-code-instruct ibm/granite-20b-code-instruct $0.0006 $0.0006 8.192 - Ficha modelo
- Página web
- Documento de investigación
granite-34b-code-instruct ibm/granite-34b-code-instruct $0.0006 $0.0006 8.192 - Ficha modelo
- Página web
- Documento de investigación
granite-vision-3-2-2b ibm/granite-vision-3-2-2b $0.0001 $0.0001 131.072 - Ficha modelo
- Página web
- Documento de investigación

 

Tabla 2b. IBM modelos de base provistos de un watsonx.ai o para pronosticar valores futuros
Nombre de modelo ID de modelo API Precio de entrada (
) (puntos de datos USD/1,000 )
Precio de salida
( USD/1,000 data points)
Longitud del contexto
Puntos de datos mínimos
Más información
granite-ttm-512-96-r2 ibm/granite-ttm-512-96-r2 $0.00013 $0.00038 512 - Modelo de ficha
- Página web
- Documento de investigación
granite-ttm-1024-96-r2 ibm/granite-ttm-1024-96-r2 $0.00013 $0.00038 1.024 - Modelo de ficha
- Página web
- Documento de investigación
granite-ttm-1536-96-r2 ibm/granite-ttm-1536-96-r2 $0.00013 $0.00038 1.536 - Modelo de ficha
- Página web
- Documento de investigación

 

Modelos de bases de terceros

La siguiente tabla enumera los modelos de fundaciones de terceros compatibles que se proporcionan con watsonx.ai.

El uso se mide en unidades de recursos (UR); cada unidad equivale a 1000 fichas de la entrada y salida de la inferencia del modelo de la fundación. Para obtener más información sobre cómo se calcula y controla el precio de los modelos, consulte Detalles de facturación de los activos de IA generativa.

Tabla 3. Modelos de fundaciones de terceros proporcionados con watsonx.ai
Nombre de modelo ID de modelo API Proveedor Precio de
USD/1,000 fichas)
Precio de
USD/1,000 fichas)
Ventana contextual
(tokens de entrada + salida)
Más información
allam-1-13b-instruct sdaia/allam-1-13b-instruct Centro Nacional de Inteligencia Artificial y Autoridad Saudita de Datos e Inteligencia Artificial $0.0018 $0.0018 4.096 - Modelo de tarjeta
elyza-japanese-llama-2-7b-instruct elyza/elyza-japanese-llama-2-7b-instruct ELYZA, Inc $0.0018 $0.0018 4.096 - Modelo de tarjeta
- Blog en note.com
flan-t5-xl-3b google/flan-t5-xl Google $0.0006 $0.0006 4.096 - Ficha modelo
- Documento de investigación
Nota : Este modelo de base puede ajustarse rápidamente.
flan-t5-xxl-11b google/flan-t5-xxl Google $0.0018 $0.0018 4.096 - Modelo de tarjeta
" - Documento de investigación
flan-ul2-20b google/flan-ul2 Google $0.0050 $0.0050 4.096 Modelo de tarjeta
documento de investigación UL2
Documento de investigación sobre el flan
jais-13b-chat core42/jais-13b-chat Inception, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) y Cerebras Systems $0.0018 $0.0018 2.048 - Modelo de tarjeta
" - Documento de investigación
llama-3-3-70b-instruct meta-llama/llama-3-3-70b-instruct Meta $0.00071 $0.00071 131.072 - Modelo de tarjeta
- ' Meta AI blog
llama-3-2-1b-instruct meta-llama/llama-3-2-1b-instruct Meta $0.0001 $0.0001 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-3-2-3b-instruct meta-llama/llama-3-2-3b-instruct Meta $0.00015 $0.00015 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-3-2-11b-vision-instruct meta-llama/llama-3-2-11b-vision-instruct Meta $0.00035 $0.00035 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-3-2-90b-vision-instruct meta-llama/llama-3-2-90b-vision-instruct Meta $0.0020 $0.0020 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-guard-3-11b-vision meta-llama/llama-guard-3-11b-vision Meta $0.00035 $0.00035 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-3-1-8b-instruct meta-llama/llama-3-1-8b-instruct Meta $0.0006 $0.0006 131.072 - Modelo de tarjeta
- ' Meta AI blog
llama-3-1-70b-instruct meta-llama/llama-3-1-70b-instruct Meta $0.0018 $0.0018 131.072 - Modelo de tarjeta
- ' Meta AI blog
llama-3-405b-instruct meta-llama/llama-3-405b-instruct Meta $0.0050 $0.016 16.384 - Modelo de tarjeta
- ' Meta AI blog
llama-2-13b-chat meta-llama/llama-2-13b-chat Meta $0.0006 $0.0006 4.096 - Modelo de tarjeta
" - Documento de investigación
mistral-large mistralai/mistral-large Mistral AI $0.003 $0.01 131.072 - Ficha de modelo
" - Entrada de blog para Mistral Large 2
mistral-small-24b-instruct-2501 mistralai/mistral-small-24b-instruct-2501 Mistral AI $0.00035 $0.00035 32.768 Tarjeta de modelo
Entrada de blog para Mistral Small 3
mixtral-8x7b-instruct-v01 mistralai/mixtral-8x7b-instruct-v01 Mistral AI $0.0006 $0.0006 32.768 - Modelo de tarjeta
" - Documento de investigación
mt0-xxl-13b bigscience/mt0-xxl BigScience $0.0018 $0.0018 4.096 - Modelo de tarjeta
" - Documento de investigación
pixtral-12b mistralai/pixtral-12b Mistral AI $0.00035 $0.00035 128.000 - Modelo de ficha
- Blog de Pixtral 12B

Implantar modelos de cimientos bajo demanda

Puede trabajar con un modelo de fundación de un conjunto de modelos seleccionados por la Fundación de la Familia Tiffany ( IBM ) para implementarlo para uso exclusivo de su organización.

IBM desplegar modelos de base bajo demanda

La siguiente tabla enumera los modelos de bases e IBM es que puede implementar bajo demanda.

Algunos modelos de base de datos de IBM también están disponibles en repositorios de terceros, como Hugging Face. IBM no indemnizará los modelos de IBM Foundation que usted obtenga de un repositorio de terceros. Sólo los modelos fundacionales IBM a los que acceda desde watsonx.ai están indemnizados por IBM. Para obtener más información sobre las protecciones contractuales relacionadas con la indemnización de IBM, consulte el Acuerdo de relación con el cliente IBM y la descripción del servicio IBM watsonx.ai.

Tabla 4. Modelos básicos de IBM disponibles para su despliegue bajo demanda en watsonx.ai
Nombre de modelo Precio por hora en USD Categoría de alojamiento de modelos Ventana contextual
(tokens de entrada + salida)
granite-7b-lab $5.22 Pequeña 4.096
granite-8b-japanese $5.22 Pequeña 4.096
granite-20b-multilingual $5.22 Pequeña 8.192
granite-13b-chat-v2 $5.22 Pequeña 8.192
granite-13b-instruct-v2 $5.22 Pequeña 8.192
granite-3b-code-instruct $5.22 Pequeña 128.000
granite-8b-code-instruct $5.22 Pequeña 128.000
granite-20b-code-instruct $5.22 Pequeña 8.192
granite-34b-code-instruct $5.22 Pequeña 8.192
granite-20b-code-base-schema-linking $5.22 Pequeña 8.192
granite-20b-code-base-sql-gen $5.22 Pequeña 8.192
granite-3-8b-base $5.22 Pequeña 4.096

 

Implementación de modelos de base a petición de terceros

La siguiente tabla enumera los modelos de bases de terceros que puede implementar bajo demanda.

Tabla 5. Modelos de cimientos de terceros disponibles para su despliegue bajo demanda en watsonx.ai
Nombre de modelo Proveedor Precio por hora en USD Categoría de alojamiento de modelos Ventana contextual
(tokens de entrada + salida)
allam-1-13b-instruct Centro Nacional de Inteligencia Artificial y Autoridad Saudita de Datos e Inteligencia Artificial $5.22 Pequeña 4.096
deepseek-r1-distill-llama-8b DeepSeek IA $5.22 Pequeña 131.072
deepseek-r1-distill-llama-70b DeepSeek IA $20.85 Grande 131.072
eurollm-1-7b-instruct Proyecto completo $5.22 Pequeña 4.096
eurollm-9b-instruct Proyecto completo $5.22 Pequeña 4.096
flan-t5-xl-3b Google $5.22 Pequeña 4.096
flan-t5-xxl-11b Google $5.22 Pequeña 4.096
flan-ul2-20b Google $5.22 Pequeña 4.096
llama-2-13b-chat Meta $5.22 Pequeña 4.096
llama-2-70b-chat Meta $20.85 Grande 4.096
llama-3-8b-instruct Meta $5.22 Pequeña 8.192
llama-3-70b-instruct Meta $20.85 Grande 8.192
llama-3-1-8b Meta $5.22 Pequeña 131.072
llama-3-1-8b-instruct Meta $5.22 Pequeña 131.072
llama-3-1-70b-instruct Meta $20.85 Grande 131.072
llama-3-3-70b-instruct Meta $10.40 Medio 131.072
llama-3-3-70b-instruct-hf Meta $20.85 Grande 131.072
mixtral-8x7b-base Mistral AI $10.40 Medio 32.768
mixtral-8x7b-instruct-v01 Mistral AI $10.40 Medio 32.768
mistral-large-instruct-2407 Mistral AI 55.15 (Ver nota) Grande 131.072
mistral-large-instruct-2411 Mistral AI 55.15 (Ver nota) Grande 131.072
mistral-nemo-instruct-2407 Mistral AI $5.22 Pequeña 131.072
mt0-xxl-13b BigScience $5.22 Pequeña 4.096

 

Nota:Existe una tarifa de acceso por hora asociada al alojamiento de los modelos de fundación mistral-large-instruct-2411 y mistral-large-instruct-2407 de Mistral AI para uso exclusivo. El precio total para alojar estos modelos de despliegue de base bajo demanda es la suma del precio de acceso más el precio de alojamiento.

Alojamiento: $ 20.85 + Acceso: $ 34.30 = Total: $ 55.15 USD por hora

Más información

Tema principal: Soluciones de IA general