0 / 0
Volver a la versión inglesa de la documentación
Gestión de la implantación de un foundation model personalizado
Última actualización: 28 nov 2024
Gestión de la implantación de un foundation model personalizado

Después de desplegar un foundation model personalizado, puede gestionar y actualizar el despliegue.

Puede gestionar y actualizar un foundation model desplegado desde la interfaz de usuario de un espacio de despliegue o mediante programación.

Gestión de implantaciones de foundation model personalizados desde el espacio de implantación

Puede acceder, actualizar, escalar, eliminar y supervisar el rendimiento de su despliegue de modelos personalizados en su espacio de despliegue.

Acceso a los detalles del despliegue desde el espacio de despliegue

Siga estos pasos para revisar o actualizar los detalles del despliegue:

  1. En la pestaña Despliegues de su espacio de despliegue, haga clic en un nombre de despliegue.
  2. Haga clic en la pestaña Detalles de implantación para acceder a la información relacionada con la implantación de su foundation model personalizado.
Nota: Si su organización utiliza cualquiera de los casos de uso para realizar el seguimiento y gobernar los activos, la información de despliegue de un activo rastreado se registra en una ficha informativa en el caso de uso asociado.

Actualización de los detalles de despliegue desde el espacio de despliegue

Puede actualizar los detalles de la implantación de su foundation model personalizado, como el nombre, el nombre de servicio, la descripción y las especificaciones de hardware. Para obtener más información, consulte Actualización de una implantación.

Ampliación de un despliegue en un espacio de despliegue

Puede escalar su despliegue aumentando el número de copias que se crean para su despliegue. Para obtener más información, consulte Escalado de una implantación.

Supresión de un despliegue desde un espacio de despliegue

Puede eliminar la implantación de su foundation model personalizado cuando ya no lo necesite, para liberar recursos. Para obtener más información, consulte Eliminación de una implantación.

Nota:

En los flujos de trabajo en los que su foundation model personalizado se utiliza periódicamente, considere la posibilidad de asignar a su modelo el mismo nombre de servicio cada vez que lo despliegue. De esta manera, después de eliminar y volver a desplegar el modelo, puede seguir utilizando el mismo punto final en su código.

Supervisión del rendimiento del despliegue desde un espacio de despliegue

Puede evaluar su despliegue personalizado de " foundation model " para medir el rendimiento y comprender las predicciones del modelo mediante el aprovisionamiento de una instancia de " watsonx.governance " y la configuración de monitores de equidad, calidad, desviación y explicabilidad. Para obtener más información, consulte Evaluación de implantaciones en espacios con watsonx.governance.

Gestión programática de la implantación de un foundation model personalizado

Requisitos previos

Puede acceder, actualizar, escalar, eliminar y supervisar el rendimiento de su despliegue de modelos personalizados mediante programación.

Para utilizar la API watsonx.ai, necesitas un token de portador. Para obtener más información, consulte Credenciales de acceso programático.

Actualizar una implantación mediante programación

Para actualizar o eliminar un despliegue mediante programación, primero obtenga la lista de modelos desplegados para encontrar los metadatos correctos para el despliegue.

Obtener la lista de modelos desplegados

Obtiene la lista de despliegues para el ID de proyecto especificado. Para filtrar todos los despliegues que apuntan a modelos de cimientos personalizados, utilice el parámetro de consulta type=custom_foundation_model. Consulte este código de ejemplo:

curl -X GET "https://<your cloud hostname>/ml/v4/deployments?version=2024-01-29&project_id=<your project ID>&type=custom_foundation_model" \
-H "Authorization: Bearer $TOKEN"

Campos que puede actualizar en un modelo desplegado:

  • name
  • description
  • tags
  • serving_name
  • asset
  • hardware_spec
  • software_spec
  • /online/parameters
  • /online/parameters/serving_name
  • /online/parameters/foundation_model

Por ejemplo:

curl -X PATCH "https://<your cloud hostname>//ml/v4/deployments/<your deployment ID>?version=2024-01-29&project_id=<your project ID>" \
-H "Authorization: Bearer $TOKEN" \
-H "content-type: application/json" \
--data '[{
 "op": "replace",
 "path": "/name",
 "value": "<updated deployment name>"
}]'

Eliminación programática de la implantación

Si desea eliminar el despliegue de su foundation model personalizado, utilice este código:

curl -vk -X DELETE "https://<your cloud hostname>/ml/v4/deployments/<your deployment ID>?version=2024-01-29&project_id=<your project ID>" -H "Authorization: Bearer $TOKEN"

Supervisión del rendimiento del despliegue desde un espacio de despliegue

Puede evaluar su despliegue personalizado de " foundation model " para medir el rendimiento y comprender las predicciones del modelo mediante el aprovisionamiento de una instancia de " watsonx.governance " y la configuración de monitores de equidad, calidad, desviación y explicabilidad. Para obtener más información, consulte Evaluación de implantaciones en espacios con watsonx.governance.

Ampliación programática de la implantación

Consulte Escalado programático de una implantación.

Próximos pasos

Aprenda a solicitar un foundation model personalizado

Tema padre: Despliegue de modelos personalizados de la fundación

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información