Despliegue una plantilla de solicitud para que pueda añadirla a un flujo de trabajo empresarial o para que pueda evaluar la plantilla de solicitud para medir el rendimiento.
Promocionar una plantilla de solicitud a un espacio de despliegue
Para promover una plantilla de aviso a un espacio de despliegue, su plantilla de aviso debe contener al menos una variable.
No puede promover plantillas de avisos que no contengan ninguna variable a su espacio de despliegue.
Para desplegar plantillas de avisos sin variables, debe exportar el Proyecto que contiene el activo de plantilla de avisos e importar el Proyecto a su espacio de despliegue. Para obtener más información, consulte Importación de una plantilla de avisos a un espacio de despliegue.
Tenga en cuenta estas consideraciones adicionales para desplegar una plantilla de avisos:
- Sólo puede crear despliegues de plantillas rápidas que hagan referencia a despliegues de modelos en el mismo proyecto o espacio en el que creó el despliegue de modelos. Si promociona una plantilla que hace referencia a un modelo desplegado en un espacio, se añade automáticamente una copia del activo del modelo al espacio. Debe desplegar el modelo en el espacio antes de desplegar la plantilla de avisos.
- Si exporta una plantilla de consulta que hace referencia a un modelo desplegado, el activo de modelo asociado se exporta automáticamente con la plantilla de consulta. Al importar el modelo a un nuevo contenedor, también se importa el modelo. El modelo debe desplegarse en el nuevo contenedor antes de desplegar la plantilla de solicitud.
Antes de empezar
Guarde una plantilla de solicitud que contenga al menos una variable como activo de proyecto. Consulte Creación de solicitudes reutilizables.
Debe configurar sus credenciales de tarea generando una clave API. Para obtener más información, consulte Gestión de credenciales de tareas.
Procedimiento
Para desplegar una plantilla de solicitud, realice los pasos siguientes:
- Abra el proyecto que contiene la plantilla de solicitud.
- Pulse Promocionar a espacio para la plantilla.
En el campo Espacio de despliegue de destino , elija un espacio de despliegue o cree un espacio nuevo. Tenga en cuenta lo siguiente:
El espacio de despliegue debe estar asociado con una instancia de aprendizaje automático que esté en la misma cuenta que el proyecto donde se ha creado la plantilla de solicitud.
Si no tiene un espacio de despliegue, elija Crear un nuevo espacio de desplieguey, a continuación, siga los pasos de Creación de espacios de despliegue.
Si tiene previsto evaluar la plantilla de solicitud en el espacio, el tipo Etapa de despliegue recomendado para el espacio es Producción. Para obtener más información sobre la evaluación, consulte Evaluación de una plantilla de solicitud en un espacio de despliegue.
Nota: La etapa de espacio de despliegue no se puede cambiar después de crear el espacio.Sugerencia: Seleccione Ver despliegue en el espacio de despliegue después de crear. De lo contrario, debe realizar más pasos para encontrar el activo desplegado.
En el separador Activos del espacio de despliegue, pulse Desplegar. Cree un despliegue en línea, lo que significa que puede enviar datos al punto final y recibir una respuesta en tiempo real.
Opcional: En el campo Nombre de servicio de despliegue , añada una etiqueta exclusiva para el despliegue.
El nombre de servicio se utiliza en la URL del punto final de la API que identifica su implantación. La adición de un nombre es útil porque el nombre legible por el usuario que se añade sustituye un ID exclusivo generado por el sistema y largo que se asigna de otro modo.
El nombre de servicio también abstrae el despliegue de sus detalles de instancia de servicio. Las aplicaciones hacen referencia a este nombre, lo que permite cambiar la instancia de servicio subyacente sin afectar a los usuarios.
El nombre puede tener hasta 36 caracteres. Los caracteres soportados son [a-z,0-9, _].
El nombre debe ser exclusivo en la región de IBM Cloud . Es posible que se le solicite que cambie el nombre de servicio si el nombre que elija ya está en uso.
Importación de una plantilla de solicitud a un espacio de despliegue
Para desplegar plantillas de avisos sin variables, debe exportar el Proyecto que contiene el activo de plantilla de avisos e importar el Proyecto a su espacio de despliegue.
Antes de empezar
Exporte el proyecto que contiene la plantilla como un archivo ZIP.
Procedimiento
Para importar un activo de plantilla a un espacio de despliegue, siga estos pasos:
En la barra de herramientas de su espacio de despliegue, seleccione el menú desplegable " Espacio de exportación/importación " " y haga clic en " Espacio de importación.
Cargue el archivo ZIP que contiene su activo de plantilla de avisos exportado desde su Proyecto y haga clic en Hecho.
Prueba de la plantilla de solicitud desplegada
Una vez que el despliegue se haya completado correctamente, pulse el nombre de despliegue para ver el despliegue.
- El separador Referencia de API incluye los puntos finales de API y los fragmentos de código que necesita para añadir esta plantilla de solicitud a una aplicación.
- La pestaña Probar da soporte a la prueba de la plantilla de solicitud. Especifique datos de prueba como texto, texto en modalidad continua o en un archivo JSON.
Si el servicio watsonx.governance está habilitado, también verá estos separadores:
- Evaluar proporciona las herramientas para evaluar la plantilla de solicitud en el espacio. Pulse Activar para elegir las dimensiones a evaluar. Para obtener detalles, consulte Evaluación de plantillas de solicitud.
- AI Factsheets muestra todos los metadatos recopilados para la plantilla de solicitud. Utilice estos detalles para realizar el seguimiento de la plantilla de solicitud para los objetivos de gobierno y conformidad. Consulte Seguimiento de plantillas de solicitud.
Despliegue programático de una plantilla de avisos
Cuando despliegue una plantilla de avisos mediante programación, deberá seguir los siguientes pasos:
- Mueva el activo de modelo y la plantilla de solicitud a un espacio de despliegue. Por ejemplo, si utiliza la API watsonx.ai, busque la plantilla y analice la dirección
model_id
almacenada enprompt.model_id
. Si utiliza la API básica común de datos e IA, utiliceentity.wx_prompt.prompt.model_id
. El ID es una cadena de claves dividida por:
. El último elemento de la cadena es la clave del recurso del modelo, que hace referencia al activo del modelo asociado a la plantilla. - Despliegue el modelo, utilizando la clave de recurso del modelo del primer paso para localizar el modelo a desplegar para la plantilla. Por ejemplo, si utiliza la API de datos y AI Common Core API, la solicitud de búsqueda busca el ID del espacio o proyecto (
XXX
), el token del usuario (YYY
) y la clave del recurso modelo asociada a la plantilla de solicitud (ZZZ
).
curl --location 'https://api.dataplatform.cloud.ibm.com/v2/asset_types/wml_model/search?space_id=XXX' \
--header 'Authorization: Bearer YYY' \
--header 'Content-Type: application/json' \
--data '{
"query": "(asset.resource_key:ZZZ)",
"include": "entity",
"limit": 100
}'
- Una vez que el modelo se haya desplegado correctamente, despliegue la plantilla de consulta
Más información
Evaluación de una plantilla de solicitud en un espacio de despliegue
Siga la guía de aprendizaje Inicio rápido: Evaluar y realizar un seguimiento de una plantilla de solicitud para evaluar y realizar un seguimiento de una plantilla de solicitud de ejemplo
Consulte la publicación del blog IBM watsonx.governance para obtener información sobre la gestión y la garantía del rendimiento de los modelos de IA-Un enfoque prescriptivo para obtener sugerencias sobre cómo operacionalizar aplicaciones empresariales y flujos de trabajo con inferencia de IA utilizando la plantilla de solicitud desplegada en un cuaderno
Tema padre: Despliegue y gestión de activos