Métodos de implementación del modelo de fundación en watsonx.ai
Puede elegir entre una colección de modelos de bases de terceros y de la fundación IBM para inferir en IBM watsonx.ai. Encuentre los modelos de base que mejor se adapten a las necesidades de su aplicación de IA generativa y a su presupuesto.
Puede alojar modelos de la fundación en watsonx.ai de varias maneras.
Si desea implementar modelos de base en su propio centro de datos, puede adquirir el softwar watsonx.ai. Para obtener más información, consulte la descripción general del software IBM watsonx.ai y IBM watsonx.governance.
Según la forma en que se alojan los modelos de base en watsonx.ai, se clasifican en:
- Modelos de base proporcionados
- Implementar modelos de base bajo demanda
- Modelos fundacionales personalizados
- Modelos de base de maquillaje con ajuste rápido
Comparación de métodos de implementación
Para ayudarle a elegir el método de implementación que mejor se adapte a su caso de uso, revise la tabla comparativa.
Tipo de despliegue | Disponible desde | Mecanismo de implementación | entorno de alojamiento | Método de facturación | Política de desuso |
---|---|---|---|---|---|
Modelos de base proporcionados con watsonx.ai | • Centro de recursos>Pago por token • Prompt Lab |
Seleccionado e implementado por IBM | Hardware multitenant | Por fichas utilizadas | Obsoleto según el ciclo de vida publicado. Véase el ciclo de vida del modelo de la Fundación. |
Implementar modelos de base bajo demanda | • Centro de recursos>Pago por horas • Prompt Lab |
Seleccionado e implementado por IBM a petición suya | Hardware dedicado | Por hora desplegada | Tu modelo implementado no está obsoleto |
Modelos fundacionales personalizados | • Prompt Lab | Seleccionado e implementado por usted | Hardware dedicado | Por hora desplegada | No obsoleto |
Modelos de base de maquillaje con ajuste rápido | • Prompt Lab | Sintonizado y desplegado por usted | Hardware multitenant | • La formación se factura por CUH ( ). • Las inferencias se facturan por fichas utilizadas |
Obsoleto cuando el modelo subyacente está obsoleto, a menos que añadas el modelo subyacente como modelo de base personalizado |
Para obtener más información sobre cómo se calcula y supervisa el precio de los modelos, consulte Detalles de facturación para activos generativos de IA.
Modelos de base proporcionados listos para usar
Una colección de modelos de terceros y de la fundación IBM se implementan en hardware multiusuario en IBM watsonx.ai por IBM. Puede solicitar estos modelos de base en el Prompt Lab o mediante programación. Paga en función del número de fichas utilizadas.
Para empezar a inferir un modelo de base proporcionado, siga estos pasos:
- En el menú principal, seleccione Centro de recursos.
- Haga clic en Ver todo en la sección Pago por token.
- Haga clic en un mosaico de modelo de base y, a continuación, haga clic en Abrir en Prompt Lab.
Implementar modelos de base bajo demanda
Un modelo de implementación bajo demanda es un ejemplo de un modelo de base curada por el departamento de TI ( IBM ) que usted implementa y que está dedicado para el uso exclusivo de su organización. Solo los colegas a los que se les conceda acceso a la implementación podrán inferir el modelo de base. Un despliegue dedicado significa interacciones más rápidas y con mayor capacidad de respuesta sin límites de velocidad.
Para trabajar con un modelo de base de despliegue bajo demanda, siga estos pasos:
- En el menú principal, seleccione Centro de recursos.
- Haga clic en Ver todo en la sección Pago por hora.
- Haga clic en un mosaico de modelo de base y, a continuación, haga clic en Implementar.
Para obtener más información, consulte Implementación de modelos de base bajo demanda.
Modelos fundacionales personalizados
Además de trabajar con modelos de bases que son seleccionados por IBM, puedes cargar y desplegar tus propios modelos de bases. Después de que los modelos personalizados se implementen y se registren en watsonx.ai, puede crear mensajes que infieran los modelos personalizados de la API Prompt Lab o watsonx.ai.
La instancia del modelo de base personalizada que implementa está dedicada para su uso. Un despliegue dedicado significa interacciones más rápidas y con mayor capacidad de respuesta. Paga por el alojamiento del modelo de fundación por horas.
Para obtener más información sobre cómo cargar, registrar e implementar un modelo de base personalizado, consulte Implementación de un modelo de base personalizado.
Modelos de base de maquillaje con ajuste rápido
Un subconjunto de los modelos de base proporcionados puede personalizarse para sus necesidades ajustando rápidamente el modelo desde la API de watsonx.ai o Tuning Studio. Un modelo de base de tono ajustado se basa en el modelo de base desplegado subyacente. El modelo subyacente puede quedar obsoleto. Usted paga por los recursos que consume para ajustar el modelo. Después de que el modelo esté sintonizado, usted paga mediante fichas utilizadas para inferir el modelo.
Puede personalizar los siguientes modelos de bases de maquillaje ajustándolos rápidamente en watsonx.ai:
Para más información, consulte Tuning Studio.
Más información
Para ver la lista completa de modelos con los que puede trabajar en watsonx.ai, consulte Modelos de bases compatibles.
Tema principal: Soluciones de inteligencia artificial