Después de desplegar un foundation model personalizado, puede gestionar y actualizar el despliegue.
Puede gestionar y actualizar un foundation model desplegado desde la interfaz de usuario de un espacio de despliegue o mediante programación.
Gestión de implantaciones de foundation model personalizados desde el espacio de implantación
Puede acceder, actualizar, escalar, eliminar y supervisar el rendimiento de su despliegue de modelos personalizados en su espacio de despliegue.
Acceso a los detalles del despliegue desde el espacio de despliegue
Siga estos pasos para revisar o actualizar los detalles del despliegue:
- En la pestaña Despliegues de su espacio de despliegue, haga clic en un nombre de despliegue.
- Haga clic en la pestaña Detalles de implantación para acceder a la información relacionada con la implantación de su foundation model personalizado.
Actualización de los detalles de despliegue desde el espacio de despliegue
Puede actualizar los detalles de la implantación de su foundation model personalizado, como el nombre, el nombre de servicio, la descripción y las especificaciones de hardware. Para obtener más información, consulte Actualización de una implantación.
Ampliación de un despliegue en un espacio de despliegue
Puede escalar su despliegue aumentando el número de copias que se crean para su despliegue. Para obtener más información, consulte Escalado de una implantación.
Supresión de un despliegue desde un espacio de despliegue
Puede eliminar la implantación de su foundation model personalizado cuando ya no lo necesite, para liberar recursos. Para obtener más información, consulte Eliminación de una implantación.
En los flujos de trabajo en los que su foundation model personalizado se utiliza periódicamente, considere la posibilidad de asignar a su modelo el mismo nombre de servicio cada vez que lo despliegue. De esta manera, después de eliminar y volver a desplegar el modelo, puede seguir utilizando el mismo punto final en su código.
Supervisión del rendimiento del despliegue desde un espacio de despliegue
Puede evaluar su despliegue personalizado de " foundation model " para medir el rendimiento y comprender las predicciones del modelo mediante el aprovisionamiento de una instancia de " watsonx.governance " y la configuración de monitores de equidad, calidad, desviación y explicabilidad. Para obtener más información, consulte Evaluación de implantaciones en espacios con watsonx.governance.
Gestión programática de la implantación de un foundation model personalizado
Requisitos previos
Puede acceder, actualizar, escalar, eliminar y supervisar el rendimiento de su despliegue de modelos personalizados mediante programación.
Para utilizar la API watsonx.ai, necesitas un token de portador. Para obtener más información, consulte Credenciales de acceso programático.
Actualizar una implantación mediante programación
Para actualizar o eliminar un despliegue mediante programación, primero obtenga la lista de modelos desplegados para encontrar los metadatos correctos para el despliegue.
Obtener la lista de modelos desplegados
Obtiene la lista de despliegues para el ID de proyecto especificado. Para filtrar todos los despliegues que apuntan a modelos de cimientos personalizados, utilice el parámetro de consulta type=custom_foundation_model
. Consulte este código de ejemplo:
curl -X GET "https://<your cloud hostname>/ml/v4/deployments?version=2024-01-29&project_id=<your project ID>&type=custom_foundation_model" \
-H "Authorization: Bearer $TOKEN"
Campos que puede actualizar en un modelo desplegado:
name
description
tags
serving_name
asset
hardware_spec
software_spec
/online/parameters
/online/parameters/serving_name
/online/parameters/foundation_model
Por ejemplo:
curl -X PATCH "https://<your cloud hostname>//ml/v4/deployments/<your deployment ID>?version=2024-01-29&project_id=<your project ID>" \
-H "Authorization: Bearer $TOKEN" \
-H "content-type: application/json" \
--data '[{
"op": "replace",
"path": "/name",
"value": "<updated deployment name>"
}]'
Eliminación programática de la implantación
Si desea eliminar el despliegue de su foundation model personalizado, utilice este código:
curl -vk -X DELETE "https://<your cloud hostname>/ml/v4/deployments/<your deployment ID>?version=2024-01-29&project_id=<your project ID>" -H "Authorization: Bearer $TOKEN"
Supervisión del rendimiento del despliegue desde un espacio de despliegue
Puede evaluar su despliegue personalizado de " foundation model " para medir el rendimiento y comprender las predicciones del modelo mediante el aprovisionamiento de una instancia de " watsonx.governance " y la configuración de monitores de equidad, calidad, desviación y explicabilidad. Para obtener más información, consulte Evaluación de implantaciones en espacios con watsonx.governance.
Ampliación programática de la implantación
Próximos pasos
Aprenda a solicitar un foundation model personalizado
Tema padre: Despliegue de modelos personalizados de la fundación