0 / 0
Volver a la versión inglesa de la documentación
Despliegue de modelos de cimentación bajo demanda (vía rápida)
Última actualización: 05 dic 2024
Despliegue de modelos de cimentación bajo demanda (vía rápida)

Implante un foundation model bajo demanda en hardware dedicado en unos pocos pasos. IBM watsonx.ai proporciona un conjunto curado de modelos de base populares que puede desplegar bajo demanda en un espacio de despliegue dedicado para uso exclusivo de los usuarios con acceso al espacio. La forma más rápida de desplegar un foundation model a petición consiste en seleccionar y desplegar un modelo desde el Centro de recursos.

Antes de empezar

  1. Debe configurar o habilitar sus credenciales de tarea para desplegar modelos de cimientos bajo demanda. Para obtener más información, consulte Gestión de credenciales de tareas.
  2. Revise las arquitecturas de " foundation model " compatibles, los tipos de despliegue y otras consideraciones para desplegar un " foundation model " a petición. Para obtener más información, consulte Despliegue de modelos de la base a petición.

Vea este vídeo para saber cómo desplegar un foundation model a petición.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Implantación de un foundation model a la carta

Para desplegar un foundation model a petición desde el centro de recursos, siga estos pasos:

  1. Abra el centro de recursos desde el menú de navegación " Icono del menú de navegación.

    Consejo:

    Seleccione el archivador Despliegue a petición para ver una lista de modelos que puede desplegar a petición.

  2. En la sección Pago por horas, busque el modelo que desea desplegar bajo demanda.

    Captura de pantalla que muestra la lista de modelos de cimientos disponibles para el despliegue a petición en el Centro de recursos

  3. En la página de detalles del modelo, haga clic en Desplegar.

    Captura de pantalla de la página de detalles del modelo

  4. Haga clic en " Despliegue en el mosaico " foundation model " y, a continuación, elija el espacio de despliegue en el que desea que se despliegue el " foundation model ".

    La captura de pantalla muestra cómo crear el despliegue

    Importante:

    Sólo puede desplegar una instancia de un foundation model bajo demanda en un espacio de despliegue. Si el modelo seleccionado ya está desplegado, el enlace de despliegue existente estará disponible para el usuario en la sección Detalles. Para obtener más información, consulte Solución de problemas de watsonx.ai Runtime.

  5. Pulse Crear.

Una vez desplegado el modelo, puede solicitar el foundation model desde el Prompt Lab o la API watsonx.ai.

Probar el despliegue

Siga estos pasos para probar un foundation model que se despliega a petición:

  1. En su espacio de despliegue, abra la pestaña Despliegues y haga clic en el nombre del despliegue.

  2. Haga clic en la pestaña Prueba para introducir un texto y obtener una respuesta del activo desplegado.

  3. Introduzca los datos de prueba en uno de los siguientes formatos, en función del tipo de activo que haya desplegado:

    a. Texto: Introduzca datos de entrada de texto para generar un bloque de texto como salida.
    b. Flujo: Introduzca datos de entrada de texto para generar un flujo de texto como salida.
    c. JSON: Introduzca los datos de entrada JSON para generar la salida en formato JSON.

    foundation model pruebas desplegado a la carta

  4. Haga clic en Generar para obtener resultados basados en su consulta.

Gestión del despliegue

Acceda, actualice, escale o elimine su foundation model desplegado a petición desde el centro de recursos.

Acceso al modelo desplegado

Puede acceder al foundation model desplegado a petición desde el concentrador de recursos utilizando el enlace de despliegue.

Siga estos pasos para acceder al enlace de despliegue desde el concentrador de recursos:

  1. En el menú de navegación, vaya al centro de recursos.

  2. En el catálogo de modelos de Foundation, en el hub de recursos, seleccione el modelo que ha desplegado.

  3. En la sección Detalles de la página de detalles del modelo, haga clic en el enlace Despliegue.

    Acceso al modelo desplegado a petición desde el concentrador de recursos

Alternativamente, también puede acceder a los detalles sobre su foundation model que se despliega bajo demanda, como el ID de despliegue, la especificación de software, el activo asociado, etc. desde la página de detalles de despliegue.

Acceso al modelo de despliegue a petición desde el espacio de despliegue

Actualización de la implantación

Actualice los detalles necesarios para su foundation model que se despliega a petición, como el nombre, la descripción, las etiquetas, etc. Para obtener más información, consulte Actualización de una implantación.

Restricción: La sustitución del activo no es compatible con los modelos de cimentación que se despliegan bajo demanda.

Actualización del modelo de despliegue a petición del espacio de despliegue

Ampliación de la implantación

Sólo se puede desplegar una instancia de un foundation model bajo demanda en un espacio de despliegue. Para hacer frente a una mayor demanda, puede ampliar la implantación creando copias adicionales. Para obtener más información, consulte Ampliación de una implantación.

Actualización del modelo de despliegue a petición del espacio de despliegue

Supresión de un despliegue

Cuando haya finalizado su trabajo con el foundation model desplegado a petición, elimine el despliegue para detener los cargos de facturación. Para más información, consulte Eliminar una implantación.

Más información

Tema principal: Despliegue de modelos de la Fundación a petición

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información