Despliegue un modelo ajustado para poder añadirlo a un flujo de trabajo empresarial y empezar a utilizar los modelos base de una forma significativa.
Antes de empezar
Copy link to section
El experimento de sintonización que utilizó para sintonizar el modelo de base debe haber finalizado. Para más información, consulte Ajustar los modelos de base.
Debe configurar sus credenciales de tarea generando una clave API. Para obtener más información, consulte Gestión de credenciales de tareas.
desplegar un modelo ajustado
Copy link to section
Para desplegar un modelo ajustado, realice los pasos siguientes:
En el menú de navegación, expanda Proyectosy, a continuación, pulse Todos los proyectos.
Pulse para abrir el proyecto.
En la pestaña Activos , pulse el tipo de activo Experimentos .
Pulse para abrir el experimento de ajuste para el modelo que desea desplegar.
En la lista Modelos ajustados , busque el experimento de ajuste completado y, a continuación, pulse Nuevo despliegue.
Asigne un nombre al modelo ajustado.
El nombre del experimento de ajuste se utiliza como nombre de modelo ajustado si no lo cambia. El nombre tiene un número detrás entre paréntesis, que cuenta los despliegues. El número se inicia en uno y se incrementa en uno cada vez que se despliega este experimento de ajuste.
Opcional: añada una descripción y etiquetas.
Para el Contenedor de despliegue, elija una de las siguientes opciones:
Este proyecto: Despliega el modelo sintonizado y lo añade a tu proyecto donde puedes probar el modelo sintonizado. Puede promover el despliegue del modelo ajustado a un espacio de despliegue en cualquier momento. Elija esta opción si desea realizar más pruebas del modelo ajustado antes de utilizarlo en producción.
Espacio de despliegue: Promueve el modelo sintonizado a un espacio de despliegue y despliega el modelo sintonizado. Un espacio de despliegue está separado del proyecto donde crea el activo. Esta separación le permite promover activos de varios proyectos a un espacio y desplegar activos en más de un espacio. Elija esta opción cuando el modelo ajustado esté listo para ser promocionado para su uso en producción.
Consejo: Selecciona la opción de ver después de crear. De lo contrario, debe realizar más pasos para encontrar el modelo desplegado.
Pulse Desplegar.
Una vez desplegado el modelo ajustado, se almacena una copia del mismo en el proyecto como activo del modelo.
Utilizar un espacio de despliegue
Copy link to section
Cuando se elige un espacio de despliegue como contenedor para el modelo ajustado, éste se promueve a un espacio de despliegue y, a continuación, se despliega. Un espacio de despliegue está asociado con los siguientes servicios que utiliza para desplegar activos:
tiempo de ejecución de watsonx.ai: Un producto con herramientas y servicios que puede utilizar para crear, entrenar y desplegar modelos de aprendizaje automático. Este servicio aloja el modelo convertido.
IBM Cloud Object Storage: Una plataforma segura para almacenar datos estructurados y no estructurados. Su activo de modelo desplegado se almacena en un Cloud Object Storage bucket que está asociado a su proyecto.
Para utilizar un espacio de despliegue, siga estos pasos:
Después de elegir Espacio de despliegue como contenedor de despliegue, en el campo Espacio de despliegue de destino, elija un espacio de despliegue.
El espacio de despliegue debe estar asociado con una instancia de aprendizaje automático que esté en la misma cuenta que el proyecto donde se ha creado el modelo ajustado.
Si no tiene un espacio de despliegue, elija Crear un nuevo espacio de desplieguey, a continuación, siga los pasos de Creación de espacios de despliegue.
En el campo Nombre de servicio de despliegue , añada una etiqueta para el despliegue.
El nombre de servicio se utiliza en el URL para el punto final de la API que identifica su implementación. La adición de un nombre es útil porque el nombre legible por el usuario que añade sustituye a un ID largo generado por el sistema que se asigna de otro modo.
El nombre de servicio también abstrae el despliegue de sus detalles de instancia de servicio. Las aplicaciones pueden hacer referencia a este nombre que permite cambiar la instancia de servicio subyacente sin afectar a los usuarios.
El nombre puede tener hasta 36 caracteres. Los caracteres soportados son [a-z,0-9, _].
El nombre debe ser exclusivo en la región de IBM Cloud . Es posible que se le solicite que cambie el nombre de servicio si el nombre que elija ya está en uso.
Prueba del modelo desplegado
Copy link to section
La verdadera prueba del modelo ajustado es cómo responde a la entrada que sigue a los patrones ajustados.
Puede probar el modelo ajustado desde una de las páginas siguientes:
Proyecto: Útil cuando quieres probar tu modelo durante las fases de desarrollo y pruebas antes de pasarlo a producción.
Espacio de despliegue: útil cuando desea probar el modelo mediante programación. En el separador Referencia de API , puede encontrar información sobre los puntos finales disponibles y ejemplos de código. También puede enviar la entrada como texto y elegir devolver la salida o en una corriente, a medida que se genera la salida. Sin embargo, no puede cambiar los parámetros de solicitud para el texto de entrada.
Prompt Lab : Útil cuando se desea utilizar una herramienta con una interfaz de usuario intuitiva para solicitar modelos de bases. Puede personalizar los parámetros de solicitud para cada entrada. También puede guardar la solicitud como un cuaderno para poder interactuar con él mediante programación.
Probar el modelo de implantación en un proyecto
Copy link to section
Para probar su modelo sintonizado en el proyecto, siga los siguientes pasos:
Desde tu proyecto, haz clic en la pestaña Despliegues.
Pulse el nombre del modelo desplegado.
Pulse el separador Probar .
En el campo Datos de entrada , añada una solicitud que siga el patrón de solicitud que el modelo ajustado está entrenado para reconocer y, a continuación, pulse Generar.
Puede pulsar Ver valores de parámetro para ver los parámetros de solicitud que se aplican al modelo de forma predeterminada. Para cambiar los parámetros de la solicitud, debe ir a la página Prompt Lab.
Probar el modelo de despliegue en un espacio de despliegue
Copy link to section
Para probar su modelo ajustado en un espacio de despliegue, complete los siguientes pasos:
En el menú de navegación, seleccione Despliegues.
Pulse el nombre del espacio de despliegue donde ha desplegado el modelo ajustado.
Pulse el nombre del modelo desplegado.
Pulse el separador Probar .
En el campo Datos de entrada , añada una solicitud que siga el patrón de solicitud que el modelo ajustado está entrenado para reconocer y, a continuación, pulse Generar.
Puede pulsar Ver valores de parámetro para ver los parámetros de solicitud que se aplican al modelo de forma predeterminada. Para cambiar los parámetros de la solicitud, debe ir a la página Prompt Lab.
Prueba del modelo de implementación en Prompt Lab
Copy link to section
Para probar su modelo sintonizado en Prompt Lab, siga estos pasos:
Siga los pasos del procedimiento anterior para abrir el modelo desplegado en el espacio de proyecto o de despliegue.
En el proyecto, haga clic en Abrir en Prompt Lab. Si trabaja en un espacio de despliegue, se le pedirá que elija el proyecto en el que desea trabajar con el modelo.
Prompt Lab se abre y el modelo sintonizado que ha implementado se selecciona en el campo Modelo.
En la sección Intentar , añada una solicitud al campo Entrada que sigue el patrón de solicitud que el modelo ajustado está entrenado para reconocer y, a continuación, pulse Generar.
Para obtener más información sobre cómo utilizar el editor de mensajes, consulte Prompt Lab.