0 / 0
Volver a la versión inglesa de la documentación
Modelos de cimientos compatibles con watsonx.ai
Última actualización: 18 dic 2024
Modelos de cimientos compatibles con watsonx.ai

En IBM watsonx.ai hay disponible una colección de modelos de código abierto y de la fundación IBM para realizar inferencias. Encuentre los modelos básicos que mejor se adapten a las necesidades de su aplicación de IA generativa y a su presupuesto.

Los modelos de base que están disponibles para la inferencia desde watsonx.ai se alojan de varias maneras:

Modelos de cimentación proporcionados con watsonx.ai
Modelos básicos IBM que IBM despliega en hardware multiusuario y que están disponibles para inferencias. Se paga por fichas utilizadas. Consulte los modelos de la Fundación proporcionados con watsonx.ai.
Implantar modelos de cimientos bajo demanda
Una instancia de un foundation model IBM que usted despliega y que está dedicado a su uso de inferencia. Sólo los colegas que tienen acceso a la implantación pueden inferir el foundation model. Un despliegue dedicado significa interacciones más rápidas y receptivas sin límites de velocidad. El alojamiento del foundation model fundación se paga por horas. Véase Despliegue de modelos de cimientos a petición.
Modelos fundacionales personalizados
Modelos de la Fundación curados por usted que importa y despliega en watsonx.ai. La instancia del foundation model personalizado que despliega está dedicada para su uso. Un despliegue dedicado significa interacciones más rápidas y con mayor capacidad de respuesta. El alojamiento del foundation model fundación se paga por horas. Véase Modelos de cimientos personalizados.
Modelos de cimentación ajustados a las necesidades
Un subconjunto de los modelos de cimentación disponibles que pueden personalizarse según sus necesidades mediante el ajuste rápido del modelo desde la API o Tuning Studio. A prompt-tuned foundation model relies on the underlying IBM-deployed foundation model. Pagas por los recursos que consumes para afinar el modelo. Una vez ajustado el modelo, se paga por fichas utilizadas para inferir el modelo. Véanse los modelos de cimentación sintonizados con Prompt.

Si desea desplegar modelos de cimentación en su propio centro de datos, puede adquirir el software watsonx.ai. Para obtener más información, consulte Descripción general de IBM watsonx as a Service y el software IBM watsonx.governance.

Comparación de métodos de implantación

Para ayudarle a elegir el método de implantación adecuado, consulte la tabla comparativa.

Tabla 1. Métodos de implantación del modelo de cimentación
Tipo de despliegue Disponible desde Mecanismo de despliegue entorno de alojamiento Método de facturación Política de amortización
Modelos de cimentación proporcionados con watsonx.ai - Resource hub>Pay per token
- Prompt Lab
Curado y desplegado por IBM Hardware multiusuario Por fichas utilizadas Obsoleto según el ciclo de vida publicado
Implantar modelos de cimientos bajo demanda - Resource hub>Pago por horas
- Prompt Lab
Curado y desplegado por IBM a petición suya Hardware dedicado Por hora de despliegue Su modelo desplegado no está obsoleto
Modelos fundacionales personalizados • Prompt Lab Curada y desplegada por usted Hardware dedicado Por hora de despliegue No obsoleto
Modelos de cimentación ajustados a las necesidades • Prompt Lab Ajustado y desplegado por usted Hardware multiusuario - La formación se factura por
la CUH - La inferencia se factura por los tokens utilizados
Obsoleto cuando el modelo subyacente está obsoleto a menos que añada el modelo subyacente como un foundation model personalizado

Para obtener más información sobre cómo se calcula y controla el precio de los modelos, consulte Detalles de facturación de los activos de IA generativa.

Modelos de cimientos compatibles por método de implantación

watsonx.ai pone a su disposición varios modelos de base que puede utilizar inmediatamente o que puede desplegar en hardware dedicado para uso de su organización.

Tabla 1a. Modelos de cimientos disponibles por método de implantación
Proveedor Proporcionado con watsonx.ai
(Pago por token)
Despliegue a la carta
(Pago por horas)
IBM - granite-13b-chat-v2 (Obsoleto)
- granite-13b-instruct-v2
- granite-7b-lab (Obsoleto)
- granite-8b-japanese
- granite-3-8b-base
- granite-20b-multilingual
- granite-3-2b-instruct
- granite-3-8b-instruct
- granite-guardian-3-2b
- granite-guardian-3-8b
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
granite-13b-chat-v2
granite-13b-instruct-v2
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Google flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
Meta - llama-3-3-70b-instruct
- llama-3-2-1b-instruct
- llama-3-2-3b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct
- llama-guard-3-11b-vision-instruct
- llama-3-1-8b-instruct
- llama-3-1-70b-instruct
- llama-3-405b-instruct
- llama-3-8b-instruct (Obsoleto)
- llama-3-70b-instruct (Obsoleto)
- llama-2-13b-chat (Obsoleto)
- llama-3-3-70b-instruct
- llama-3-3-70b-instruct-hf
- llama-2-13b-chat
- llama-2-70b-chat
- llama-3-8b-instruct
- llama-3-70b-instruct
- llama-3-1-8b
- llama-3-1-8b-instruct
Mistral AI mistral-large
mixtral-8x7b-instruct-v01
pixtral-12b
mixtral-8x7b-base
mixtral-8x7b-instruct-v01
mistral-nemo-instruct-2407
BigScience mt0-xxl-13b mt0-xxl-13b
Code Llama codellama-34b-instruct
ELYZA, Inc elyza-japanese-llama-2-7b-instruct
Inicio jais-13b-chat
SDAIA allam-1-13b-instruct

Modelos de cimentación proporcionados con watsonx.ai

Una colección de modelos de base de IBM y de código abierto se despliegan en IBM watsonx.ai. Puede solicitar estos modelos de cimentación en el Prompt Lab o mediante programación.

Modelos básicos de IBM proporcionados con watsonx.ai

En la siguiente tabla se enumeran los modelos de base IBM compatibles que IBM proporciona para la inferencia.

El uso se mide en Unidades de Recursos (RU); cada unidad equivale a 1.000 tokens de la entrada y salida de la inferencia foundation model. Para obtener más información sobre cómo se calcula y controla el precio de los modelos, consulte Detalles de facturación de los activos de IA generativa.

Algunos modelos de IBM Foundation también están disponibles en repositorios de terceros, como Hugging Face. IBM no indemnizará los modelos de IBM Foundation que usted obtenga de un repositorio de terceros. Sólo los modelos fundacionales IBM a los que acceda desde watsonx.ai están indemnizados por IBM. Para obtener más información sobre las protecciones contractuales relacionadas con la indemnización de IBM, consulte el Acuerdo de relación con el cliente IBM y la descripción del servicio IBM watsonx.ai.

Tabla 2. Modelos básicos de IBM proporcionados con watsonx.ai
Nombre de modelo Precio de
USD/1,000 fichas)
Precio de
USD/1,000 fichas)
Ventana contextual
(tokens de entrada + salida)
Más información
granite-13b-chat-v2 $0.0006 $0.0006 8.192 - Ficha modelo
- Página web
- Documento de investigación
granite-13b-instruct-v2 $0.0006 $0.0006 8.192 - Modelo de ficha
- Página web
- Documento de investigación
Nota: Este foundation model puede ajustarse rápidamente.
granite-7b-lab $0.0006 $0.0006 8.192 - Tarjeta modelo
- Documento de investigación (LAB)
granite-8b-japanese $0.0006 $0.0006 4.096 - Ficha modelo
- Página web
- Documento de investigación
granite-20b-multilingual $0.0006 $0.0006 8.192 - Ficha modelo
- Página web
- Documento de investigación
granite-3-2b-instruct $0.0001 $0.0001 131.072 - Ficha modelo
- Página web
- Documento de investigación
granite-3-8b-instruct $0.0002 $0.0002 131.072 - Ficha modelo
- Página web
- Documento de investigación
granite-guardian-3-2b $0.0001 $0.0001 8.192 - Modelo de tarjeta
" - Página web
granite-guardian-3-8b $0.0002 $0.0002 8.192 - Modelo de tarjeta
" - Página web
granite-3b-code-instruct $0.0006 $0.0006 128.000 - Ficha modelo
- Página web
- Documento de investigación
granite-8b-code-instruct $0.0006 $0.0006 128.000 - Ficha modelo
- Página web
- Documento de investigación
granite-20b-code-instruct $0.0006 $0.0006 8.192 - Ficha modelo
- Página web
- Documento de investigación
granite-34b-code-instruct $0.0006 $0.0006 8.192 - Ficha modelo
- Página web
- Documento de investigación

 

Modelos de fundaciones de terceros proporcionados con watsonx.ai

La siguiente tabla enumera los modelos de fundaciones de terceros compatibles que se proporcionan con watsonx.ai.

El uso se mide en Unidades de Recursos (RU); cada unidad equivale a 1.000 tokens de la entrada y salida de la inferencia foundation model. Para obtener más información sobre cómo se calcula y controla el precio de los modelos, consulte Detalles de facturación de los activos de IA generativa.

Tabla 3. Modelos de fundaciones de terceros proporcionados con watsonx.ai
Nombre de modelo Proveedor Precio de
USD/1,000 fichas)
Precio de
USD/1,000 fichas)
Ventana contextual
(tokens de entrada + salida)
Más información
allam-1-13b-instruct Centro Nacional de Inteligencia Artificial y Autoridad Saudita de Datos e Inteligencia Artificial $0.0018 $0.0018 4.096 - Modelo de tarjeta
codellama-34b-instruct Code Llama $0.0018 $0.0018 16.384 - Modelo de tarjeta
" - " Meta AI Blog
elyza-japanese-llama-2-7b-instruct ELYZA, Inc $0.0018 $0.0018 4.096 - Modelo de tarjeta
- Blog en note.com
flan-t5-xl-3b Google $0.0006 $0.0006 4.096 - Ficha modelo
- Documento de investigación
Nota: Este foundation model puede ajustarse rápidamente.
flan-t5-xxl-11b Google $0.0018 $0.0018 4.096 - Modelo de tarjeta
" - Documento de investigación
flan-ul2-20b Google $0.0050 $0.0050 4.096 Modelo de tarjeta
documento de investigación UL2
Documento de investigación sobre el flan
jais-13b-chat Inception, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) y Cerebras Systems $0.0018 $0.0018 2.048 - Modelo de tarjeta
" - Documento de investigación
llama-3-3-70b-instruct Meta $0.0018 $0.0018 131.072 - Modelo de tarjeta
- ' Meta AI blog
llama-3-2-1b-instruct Meta $0.0001 $0.0001 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-3-2-3b-instruct Meta $0.00015 $0.00015 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-3-2-11b-vision-instruct Meta $0.00035 $0.00035 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-3-2-90b-vision-instruct Meta $0.0020 $0.0020 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-guard-3-11b-vision Meta $0.00035 $0.00035 131.072 - Modelo de ficha
- ' Meta AI blog
- Documento de investigación
llama-3-1-8b-instruct Meta $0.0006 $0.0006 131.072 - Modelo de tarjeta
- ' Meta AI blog
llama-3-1-70b-instruct Meta $0.0018 $0.0018 131.072 - Modelo de tarjeta
- ' Meta AI blog
llama-3-405b-instruct Meta $0.0050 $0.016 16.384 - Modelo de tarjeta
- ' Meta AI blog
llama-3-8b-instruct Meta $0.0006 $0.0006 8.192 - Modelo de tarjeta
- ' Meta AI blog
llama-3-70b-instruct Meta $0.0018 $0.0018 8.192 - Modelo de tarjeta
- ' Meta AI blog
llama-2-13b-chat Meta $0.0006 $0.0006 4.096 - Modelo de tarjeta
" - Documento de investigación
mistral-large Mistral AI $0.003 $0.01 32.768 - Ficha de modelo
" - Entrada de blog para Mistral Large 2
mixtral-8x7b-instruct-v01 Mistral AI $0.0006 $0.0006 32.768 - Modelo de tarjeta
" - Documento de investigación
mt0-xxl-13b BigScience $0.0018 $0.0018 4.096 - Modelo de tarjeta
" - Documento de investigación
pixtral-12b Mistral AI $0.00035 $0.00035 128.000 - Modelo de ficha
- Blog de Pixtral 12B

 

Modelos fundacionales personalizados

Además de trabajar con modelos de base curados por IBM, puede cargar y desplegar sus propios modelos de base. Una vez desplegados y registrados los modelos personalizados en watsonx.ai, puede crear avisos que inferencien los modelos personalizados desde Prompt Lab y desde la API watsonx.ai.

Para obtener más información sobre cómo cargar, registrar y desplegar un " foundation model" personalizado, consulte " Desplegar un " foundation model personalizado .

Implantar modelos de cimientos bajo demanda

Elija un foundation model de un conjunto de modelos IBM para desplegarlo para uso exclusivo de su organización.

Para más información sobre cómo desplegar un foundation model bajo demanda, consulte Despliegue de modelos de cimientos a la carta.

Nota: Los modelos Foundation que se pueden implantar bajo demanda sólo están disponibles en el centro de datos de Dallas.

Implantar modelos de cimientos bajo demanda de IBM

En la siguiente tabla se enumeran los modelos de IBM Foundation disponibles para su despliegue bajo demanda.

Algunos modelos de IBM Foundation también están disponibles en repositorios de terceros, como Hugging Face. IBM no indemnizará los modelos de IBM Foundation que usted obtenga de un repositorio de terceros. Sólo los modelos fundacionales IBM a los que acceda desde watsonx.ai están indemnizados por IBM. Para obtener más información sobre las protecciones contractuales relacionadas con la indemnización de IBM, consulte el Acuerdo de relación con el cliente IBM y la descripción del servicio IBM watsonx.ai.

Tabla 4. Modelos básicos de IBM disponibles para su despliegue bajo demanda en watsonx.ai
Nombre de modelo Precio por hora en USD Categoría de alojamiento de modelos Ventana contextual
(tokens de entrada + salida)
granite-13b-chat-v2 $5.22 Pequeña 8.192
granite-13b-instruct-v2 $5.22 Pequeña 8.192
granite-20b-code-base-schema-linking $5.22 Pequeña 8.192
granite-20b-code-base-sql-gen $5.22 Pequeña 8.192
granite-3-8b-base $5.22 Pequeña 4.096

 

Implantar modelos de cimientos bajo demanda de terceros

En la siguiente tabla se enumeran los modelos de bases de terceros que están disponibles para su implantación bajo demanda.

Tabla 5. Modelos de cimientos de terceros disponibles para su despliegue bajo demanda en watsonx.ai
Nombre de modelo Proveedor Precio por hora en USD Categoría de alojamiento de modelos Ventana contextual
(tokens de entrada + salida)
flan-t5-xl-3b Google $5.22 Pequeña 4.096
flan-t5-xxl-11b Google $5.22 Pequeña 4.096
flan-ul2-20b Google $5.22 Pequeña 4.096
llama-2-13b-chat Meta $5.22 Pequeña 4.096
llama-2-70b-chat Meta $20.85 Grande 4.096
llama-3-8b-instruct Meta $5.22 Pequeña 8.192
llama-3-70b-instruct Meta $20.85 Grande 8.192
llama-3-1-8b Meta $5.22 Pequeña 131.072
llama-3-1-8b-instruct Meta $5.22 Pequeña 131.072
llama-3-3-70b-instruct Meta $10.40 Medio 8.192
llama-3-3-70b-instruct-hf Meta $20.85 Grande 8.192
mixtral-8x7b-base Mistral AI $10.40 Medio 32.768
mixtral-8x7b-instruct-v01 Mistral AI $10.40 Medio 32.768
mistral-nemo-instruct-2407 Mistral AI $5.22 Pequeña 131.072
mt0-xxl-13b BigScience $5.22 Pequeña 4.096

 

Modelos de cimentación ajustados a las necesidades

Puede personalizar los siguientes modelos de base ajustándolos en watsonx.ai:

Para más información, consulta Tuning Studio.

Más información

Tema principal: Desarrollo de soluciones de IA generativas

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información