Implante un foundation model bajo demanda en hardware dedicado en unos pocos pasos. IBM watsonx.ai proporciona un conjunto curado de modelos de base populares que puede desplegar bajo demanda en un espacio de despliegue dedicado para uso exclusivo de los usuarios con acceso al espacio. La forma más rápida de desplegar un foundation model a petición consiste en seleccionar y desplegar un modelo desde el Centro de recursos.
Antes de empezar
- Debe configurar o habilitar sus credenciales de tarea para desplegar modelos de cimientos bajo demanda. Para obtener más información, consulte Gestión de credenciales de tareas.
- Revise las arquitecturas de " foundation model " compatibles, los tipos de despliegue y otras consideraciones para desplegar un " foundation model " a petición. Para obtener más información, consulte Despliegue de modelos de la base a petición.
Vea este vídeo para saber cómo desplegar un foundation model a petición.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Implantación de un foundation model a la carta
Para desplegar un foundation model a petición desde el centro de recursos, siga estos pasos:
Abra el centro de recursos desde el menú de navegación " .
Consejo:Seleccione el archivador Despliegue a petición para ver una lista de modelos que puede desplegar a petición.
En la sección Pago por horas, busque el modelo que desea desplegar bajo demanda.
En la página de detalles del modelo, haga clic en Desplegar.
Haga clic en " Despliegue en el mosaico " foundation model " y, a continuación, elija el espacio de despliegue en el que desea que se despliegue el " foundation model ".
Importante:Sólo puede desplegar una instancia de un foundation model bajo demanda en un espacio de despliegue. Si el modelo seleccionado ya está desplegado, el enlace de despliegue existente estará disponible para el usuario en la sección Detalles. Para obtener más información, consulte Solución de problemas de watsonx.ai Runtime.
Pulse Crear.
Una vez desplegado el modelo, puede solicitar el foundation model desde el Prompt Lab o la API watsonx.ai.
Probar el despliegue
Siga estos pasos para probar un foundation model que se despliega a petición:
En su espacio de despliegue, abra la pestaña Despliegues y haga clic en el nombre del despliegue.
Haga clic en la pestaña Prueba para introducir un texto y obtener una respuesta del activo desplegado.
Introduzca los datos de prueba en uno de los siguientes formatos, en función del tipo de activo que haya desplegado:
a. Texto: Introduzca datos de entrada de texto para generar un bloque de texto como salida.
b. Flujo: Introduzca datos de entrada de texto para generar un flujo de texto como salida.
c. JSON: Introduzca los datos de entrada JSON para generar la salida en formato JSON.Haga clic en Generar para obtener resultados basados en su consulta.
Gestión del despliegue
Acceda, actualice, escale o elimine su foundation model desplegado a petición desde el centro de recursos.
Acceso al modelo desplegado
Puede acceder al foundation model desplegado a petición desde el concentrador de recursos utilizando el enlace de despliegue.
Siga estos pasos para acceder al enlace de despliegue desde el concentrador de recursos:
En el menú de navegación, vaya al centro de recursos.
En el catálogo de modelos de Foundation, en el hub de recursos, seleccione el modelo que ha desplegado.
En la sección Detalles de la página de detalles del modelo, haga clic en el enlace Despliegue.
Alternativamente, también puede acceder a los detalles sobre su foundation model que se despliega bajo demanda, como el ID de despliegue, la especificación de software, el activo asociado, etc. desde la página de detalles de despliegue.
Actualización de la implantación
Actualice los detalles necesarios para su foundation model que se despliega a petición, como el nombre, la descripción, las etiquetas, etc. Para obtener más información, consulte Actualización de una implantación.
Ampliación de la implantación
Sólo se puede desplegar una instancia de un foundation model bajo demanda en un espacio de despliegue. Para hacer frente a una mayor demanda, puede ampliar la implantación creando copias adicionales. Para obtener más información, consulte Ampliación de una implantación.
Supresión de un despliegue
Cuando haya finalizado su trabajo con el foundation model desplegado a petición, elimine el despliegue para detener los cargos de facturación. Para más información, consulte Eliminar una implantación.
Más información
- Modelos de cimientos compatibles
- Prompt Lab
- Despliegue de modelos de la Fundación a petición mediante la API REST
- Tarifas de facturación por horas para modelos de despliegue bajo demanda
Tema principal: Despliegue de modelos de la Fundación a petición