Modelos de cimientos compatibles con watsonx.ai
Puede trabajar con modelos de base de terceros y IBM en IBM watsonx.ai.You puede utilizar modelos de base proporcionados por IBM y listos para su uso inmediato, o desplegar modelos de base bajo demanda para utilizarlos exclusivamente en su organización.
Cómo elegir un modelo
Para revisar los factores que pueden ayudarte a elegir un modelo, como las tareas e idiomas compatibles, consulta Elegir un modelo y Puntos de referencia del modelo Foundation.
La disponibilidad del modelo varía según la ubicación del centro de datos. Para más información, consulte Disponibilidad regional de servicios y funciones en IBM Cloud.
Modelos de cimientos por método de despliegue
Dependiendo del método de implementación, puede utilizar modelos de base en hardware multiusuario directamente o implementar modelos en hardware dedicado para su uso por parte de su organización. Para obtener más información sobre las diversas formas en que puede utilizar para implementar modelos, consulte Métodos de implementación de modelos de Foundation.
Modelos de base proporcionados que están listos para usar
Una colección de modelos de base de IBM y de código abierto se despliegan en IBM watsonx.ai. Puede solicitar estos modelos de cimentación en el Prompt Lab o mediante programación.
IBM modelos de base
En la siguiente tabla se enumeran los modelos de base IBM compatibles que IBM proporciona para la inferencia.
El uso se mide en unidades de recursos (UR); cada unidad equivale a 1000 fichas de la entrada y salida de la inferencia del modelo de la fundación. Para obtener más información sobre cómo se calcula y controla el precio de los modelos, consulte Detalles de facturación de los activos de IA generativa.
También puede acceder a algunos modelos de la fundación IBM desde repositorios de terceros, como Hugging Face. IBM los modelos de cimientos que obtenga de un repositorio de terceros no serán indemnizados por IBM. Sólo los modelos de la fundación IBM a los que acceda desde watsonx.ai están indemnizados por IBM. Para más información sobre las protecciones contractuales relacionadas con la indemnización de IBM, consulte el Acuerdo de Relación con el Cliente de IBM. Para más información sobre la descripción del servicio IBM watsonx.ai con varios proveedores de nube, consulte:
Nombre de modelo | ID de modelo API | Precio de USD/1,000 fichas) |
Precio de USD/1,000 fichas) |
Ventana contextual (tokens de entrada + salida) |
Más información |
---|---|---|---|---|---|
granite-3-3-8b-instruct | ibm/granite-3-3-8b-instruct |
$0.0002 | $0.0002 | 131.072 | - Modelo de tarjeta - Página web |
granite-13b-instruct-v2 | ibm/granite-13b-instruct-v2 |
$0.0006 | $0.0006 | 8.192 | - Modelo de ficha - Página web - Documento de investigación Nota : Este modelo de base puede ajustarse rápidamente.
|
granite-8b-japanese | ibm/granite-8b-japanese |
$0.0006 | $0.0006 | 4.096 | - Ficha modelo - Página web - Documento de investigación |
granite-3-2b-instruct | ibm/granite-3-2b-instruct |
$0.0001 | $0.0001 | 131.072 | - Ficha modelo - Página web - Documento de investigación |
granite-3-8b-instruct | ibm/granite-3-8b-instruct |
$0.0002 | $0.0002 | 131.072 | - Ficha modelo - Página web - Documento de investigación |
granite-3-2-8b-instruct | ibm/granite-3-2-8b-instruct |
$0.0002 | $0.0002 | 131.072 | - Ficha modelo - Página web - Documento de investigación |
granite-guardian-3-2b | ibm/granite-guardian-3-2b |
$0.0001 | $0.0001 | 131.072 | - Modelo de tarjeta " - Página web |
granite-guardian-3-8b | ibm/granite-guardian-3-8b |
$0.0002 | $0.0002 | 131.072 | - Modelo de tarjeta " - Página web |
granite-3b-code-instruct | ibm/granite-3b-code-instruct |
$0.0006 | $0.0006 | 128.000 | - Ficha modelo - Página web - Documento de investigación |
granite-8b-code-instruct | ibm/granite-8b-code-instruct |
$0.0006 | $0.0006 | 128.000 | - Ficha modelo - Página web - Documento de investigación |
granite-20b-code-instruct | ibm/granite-20b-code-instruct |
$0.0006 | $0.0006 | 8.192 | - Ficha modelo - Página web - Documento de investigación |
granite-34b-code-instruct | ibm/granite-34b-code-instruct |
$0.0006 | $0.0006 | 8.192 | - Ficha modelo - Página web - Documento de investigación |
granite-vision-3-2-2b | ibm/granite-vision-3-2-2b |
$0.0001 | $0.0001 | 131.072 | - Ficha modelo - Página web - Documento de investigación |
Nombre de modelo | ID de modelo API | Precio de entrada ( ) (puntos de datos USD/1,000 ) |
Precio de salida ( USD/1,000 data points) |
Longitud del contexto Puntos de datos mínimos |
Más información |
---|---|---|---|---|---|
granite-ttm-512-96-r2 | ibm/granite-ttm-512-96-r2 |
$0.00013 | $0.00038 | 512 | - Modelo de ficha - Página web - Documento de investigación |
granite-ttm-1024-96-r2 | ibm/granite-ttm-1024-96-r2 |
$0.00013 | $0.00038 | 1.024 | - Modelo de ficha - Página web - Documento de investigación |
granite-ttm-1536-96-r2 | ibm/granite-ttm-1536-96-r2 |
$0.00013 | $0.00038 | 1.536 | - Modelo de ficha - Página web - Documento de investigación |
Modelos de bases de terceros
La siguiente tabla enumera los modelos de fundaciones de terceros compatibles que se proporcionan con watsonx.ai.
El uso se mide en unidades de recursos (UR); cada unidad equivale a 1000 fichas de la entrada y salida de la inferencia del modelo de la fundación. Para obtener más información sobre cómo se calcula y controla el precio de los modelos, consulte Detalles de facturación de los activos de IA generativa.
Nombre de modelo | ID de modelo API | Proveedor | Precio de USD/1,000 fichas) |
Precio de USD/1,000 fichas) |
Ventana contextual (tokens de entrada + salida) |
Más información |
---|---|---|---|---|---|---|
allam-1-13b-instruct | sdaia/allam-1-13b-instruct |
Centro Nacional de Inteligencia Artificial y Autoridad Saudita de Datos e Inteligencia Artificial | $0.0018 | $0.0018 | 4.096 | - Modelo de tarjeta |
elyza-japanese-llama-2-7b-instruct | elyza/elyza-japanese-llama-2-7b-instruct |
ELYZA, Inc | $0.0018 | $0.0018 | 4.096 | - Modelo de tarjeta - Blog en note.com |
flan-t5-xl-3b | google/flan-t5-xl |
$0.0006 | $0.0006 | 4.096 | - Ficha modelo - Documento de investigación Nota : Este modelo de base puede ajustarse rápidamente.
|
|
flan-t5-xxl-11b | google/flan-t5-xxl |
$0.0018 | $0.0018 | 4.096 | - Modelo de tarjeta " - Documento de investigación |
|
flan-ul2-20b | google/flan-ul2 |
$0.0050 | $0.0050 | 4.096 | • Modelo de tarjeta • documento de investigación UL2 • Documento de investigación sobre el flan |
|
jais-13b-chat | core42/jais-13b-chat |
Inception, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) y Cerebras Systems | $0.0018 | $0.0018 | 2.048 | - Modelo de tarjeta " - Documento de investigación |
llama-4-maverick-17b-128e-instruct-fp8 | meta-llama/llama-4-maverick-17b-128e-instruct-fp |
Meta | $0.00035 | $0.0014 | 131.072 | - Modelo de tarjeta - ' Meta AI blog |
llama-4-scout-17b-16e-instruct |
meta-llama/llama-4-scout-17b-16e-instruct |
Meta | Sin coste durante el preestreno | Sin coste durante el preestreno | 131.072 | - Modelo de tarjeta - ' Meta AI blog |
llama-3-3-70b-instruct | meta-llama/llama-3-3-70b-instruct |
Meta | $0.00071 | $0.00071 | 131.072 | - Modelo de tarjeta - ' Meta AI blog |
llama-3-2-1b-instruct | meta-llama/llama-3-2-1b-instruct |
Meta | $0.0001 | $0.0001 | 131.072 | - Modelo de ficha - ' Meta AI blog - Documento de investigación |
llama-3-2-3b-instruct | meta-llama/llama-3-2-3b-instruct |
Meta | $0.00015 | $0.00015 | 131.072 | - Modelo de ficha - ' Meta AI blog - Documento de investigación |
llama-3-2-11b-vision-instruct | meta-llama/llama-3-2-11b-vision-instruct |
Meta | $0.00035 | $0.00035 | 131.072 | - Modelo de ficha - ' Meta AI blog - Documento de investigación |
llama-3-2-90b-vision-instruct | meta-llama/llama-3-2-90b-vision-instruct |
Meta | $0.0020 | $0.0020 | 131.072 | - Modelo de ficha - ' Meta AI blog - Documento de investigación |
llama-guard-3-11b-vision | meta-llama/llama-guard-3-11b-vision |
Meta | $0.00035 | $0.00035 | 131.072 | - Modelo de ficha - ' Meta AI blog - Documento de investigación |
llama-3-405b-instruct | meta-llama/llama-3-405b-instruct |
Meta | $0.0050 | $0.016 | 16.384 | - Modelo de tarjeta - ' Meta AI blog |
llama-2-13b-chat | meta-llama/llama-2-13b-chat |
Meta | $0.0006 | $0.0006 | 4.096 | - Modelo de tarjeta " - Documento de investigación |
mistral-large | mistralai/mistral-large |
Mistral AI | $0.003 | $0.01 | 131.072 | - Ficha de modelo " - Entrada de blog para Mistral Large 2 |
mistral-medium-2505 | mistralai/mistral-medium-2505 |
Mistral AI | $0.003 | $0.010 | 131.072 | - Tarjeta modelo - Blog post para Mistral Medium 3 |
mistral-small-3-1-24b-instruct-2503 | mistralai/mistral-small-3-1-24b-instruct-2503 |
Mistral AI | $0.0001 | $0.0003 | 131.072 | • Tarjeta modelo • Entrada de blog para Mistral 3.1 |
mistral-small-24b-instruct-2501 | mistralai/mistral-small-24b-instruct-2501 |
Mistral AI | $0.00035 | $0.00035 | 32.768 | • Tarjeta de modelo • Entrada de blog para Mistral Small 3 |
mixtral-8x7b-instruct-v01 | mistralai/mixtral-8x7b-instruct-v01 |
Mistral AI | $0.0006 | $0.0006 | 32.768 | - Modelo de tarjeta " - Documento de investigación |
mt0-xxl-13b | bigscience/mt0-xxl |
BigScience | $0.0018 | $0.0018 | 4.096 | - Modelo de tarjeta " - Documento de investigación |
pixtral-12b | mistralai/pixtral-12b |
Mistral AI | $0.00035 | $0.00035 | 128.000 | - Modelo de ficha - Blog de Pixtral 12B |
Implantar modelos de cimientos bajo demanda
Puede trabajar con un modelo de fundación de un conjunto de modelos seleccionados por la Fundación de la Familia Tiffany ( IBM ) para implementarlo para uso exclusivo de su organización.
IBM desplegar modelos de base bajo demanda
La siguiente tabla enumera los modelos de bases e IBM es que puede implementar bajo demanda.
Algunos modelos de cimientos de IBM también están disponibles en repositorios de terceros, como Hugging Face. IBM los modelos de cimientos que obtenga de un repositorio de terceros no serán indemnizados por IBM. Sólo los modelos de la fundación IBM a los que acceda desde watsonx.ai están indemnizados por IBM. Para más información sobre las protecciones contractuales relacionadas con la indemnización de IBM, consulte el Acuerdo de Relación con el Cliente de IBM. Para más información sobre la descripción del servicio IBM watsonx.ai con varios proveedores de nube, consulte:
Nombre de modelo | Precio por hora en USD | Categoría de alojamiento de modelos | Ventana contextual (tokens de entrada + salida) |
---|---|---|---|
granite-3-3-8b-instruct | $5.22 | Pequeña | 131.072 |
granite-3-3-2b-instruct | $5.22 | Pequeña | 131.072 |
granite-3-2-8b-instruct | $5.22 | Pequeña | 131.072 |
granite-3-1-8b-base | $5.22 | Pequeña | 131.072 |
granite-8b-japanese | $5.22 | Pequeña | 4.096 |
granite-20b-multilingual | $5.22 | Pequeña | 8.192 |
granite-13b-chat-v2 | $5.22 | Pequeña | 8.192 |
granite-13b-instruct-v2 | $5.22 | Pequeña | 8.192 |
granite-3b-code-instruct | $5.22 | Pequeña | 128.000 |
granite-8b-code-instruct | $5.22 | Pequeña | 128.000 |
granite-20b-code-instruct | $5.22 | Pequeña | 8.192 |
granite-34b-code-instruct | $5.22 | Pequeña | 8.192 |
granite-20b-code-base-schema-linking | $5.22 | Pequeña | 8.192 |
granite-20b-code-base-sql-gen | $5.22 | Pequeña | 8.192 |
granite-3-8b-base | $5.22 | Pequeña | 4.096 |
Implementación de modelos de base a petición de terceros
La siguiente tabla enumera los modelos de bases de terceros que puede implementar bajo demanda.
Nombre de modelo | Proveedor | Precio por hora en USD | Categoría de alojamiento de modelos | Ventana contextual (tokens de entrada + salida) |
---|---|---|---|---|
allam-1-13b-instruct | Centro Nacional de Inteligencia Artificial y Autoridad Saudita de Datos e Inteligencia Artificial | $5.22 | Pequeña | 4.096 |
codellama-34b-instruct-hf | Code Llama | $10.40 | Medio | 16.384 |
deepseek-r1-distill-llama-8b | DeepSeek IA | $5.22 | Pequeña | 131.072 |
deepseek-r1-distill-llama-70b | DeepSeek IA | $20.85 | Grande | 131.072 |
eurollm-1-7b-instruct | Proyecto completo | $5.22 | Pequeña | 4.096 |
eurollm-9b-instruct | Proyecto completo | $5.22 | Pequeña | 4.096 |
flan-t5-xl-3b | $5.22 | Pequeña | 4.096 | |
flan-t5-xxl-11b | $5.22 | Pequeña | 4.096 | |
flan-ul2-20b | $5.22 | Pequeña | 4.096 | |
llama-2-13b-chat | Meta | $5.22 | Pequeña | 4.096 |
llama-2-70b-chat | Meta | $20.85 | Grande | 4.096 |
llama-3-8b-instruct | Meta | $5.22 | Pequeña | 8.192 |
llama-3-70b-instruct | Meta | $20.85 | Grande | 8.192 |
llama-3-1-8b | Meta | $5.22 | Pequeña | 131.072 |
llama-3-1-70b | Meta | $20.85 | Grande | 131.072 |
llama-3-1-8b-instruct | Meta | $5.22 | Pequeña | 131.072 |
llama-3-1-70b-instruct | Meta | $20.85 | Grande | 131.072 |
llama-3-2-11b-vision-instruct | Meta | $5.22 | Pequeña | 131.072 |
llama-3-3-70b-instruct | Meta | $10.40 | Medio | 131.072 |
llama-3-3-70b-instruct-hf | Meta | $20.85 | Grande | 131.072 |
mixtral-8x7b-base | Mistral AI | $10.40 | Medio | 32.768 |
mixtral-8x7b-instruct-v01 | Mistral AI | $10.40 | Medio | 32.768 |
mistral-large-instruct-2407 | Mistral AI | $ 55.15 (Ver nota.) | Grande | 131.072 |
mistral-large-instruct-2411 | Mistral AI | $ 55.15 (Ver nota.) | Grande | 131.072 |
mistral-nemo-instruct-2407 | Mistral AI | $5.22 | Pequeña | 131.072 |
mt0-xxl-13b | BigScience | $5.22 | Pequeña | 4.096 |
poro-34b-chat | LumiOpen | $10.40 | Medio | 2.048 |
Existe una tarifa de acceso por hora asociada al alojamiento de los modelos de fundación mistral-large-instruct-2411 y mistral-large-instruct-2407 de Mistral AI para uso exclusivo. El precio total para alojar estos modelos de despliegue de base bajo demanda es la suma del precio de acceso más el precio de alojamiento.
Alojamiento: $ 20.85 + Acceso: $ 34.30 = Total: $ 55.15 USD por hora
Más información
- IBM modelos de base
- Modelos de bases de terceros
- Para obtener más información sobre los modelos de base que proporciona IBM para incrustar y reordenar texto, consulte Modelos de codificador compatibles.
- Para obtener una lista de los modelos que se proporcionan en cada centro de datos regional, consulte Disponibilidad regional de modelos base.
- Para obtener más información sobre los precios de los modelos de base, consulte Detalles de facturación para activos generativos de IA.
- Para obtener información sobre precios y limitación de tarifas, consulte watsonx.ai Planes de tiempo de ejecución.
Tema principal: Soluciones de IA general