Implantación de modelos de cimentación ajustados
Puede ajustar un modelo para adaptarlo a una tarea, conjunto de datos o caso de uso concretos. El proceso de sintonización ajusta los parámetros o pesos de un modelo preentrenado y mejora el rendimiento y la precisión del modelo. Implemente un modelo ajustado para poder añadirlo a un flujo de trabajo empresarial y empezar a utilizar los modelos básicos de forma significativa.
Formas de trabajar
Sea cual sea el método que utilice para sintonizar su modelo, debe esperar a que el experimento de sintonización termine de ejecutarse antes de desplegar el modelo sintonizado.
Dependiendo del método que elija para entrenar su modelo, puede desplegar modelos sintonizados de las siguientes maneras:
- Desde la interfaz de usuario de proyectos: Una interfaz gráfica de usuario para desplegar modelos sintonizados que se almacenan como activos de experimentos de sintonización en su proyecto. Para obtener más información, consulte Despliegue de un modelo ajustado desde un proyecto.
- Métodos programáticos para desplegar modelos sintonizados: Utilice estos métodos para modelos ajustados con parámetros eficientes (PEFT).
Después de desplegar un modelo ajustado, puede inferir el modelo proporcionando datos de texto como entrada para generar predicciones en tiempo real.
Despliegue de un modelo ajustado desde un proyecto
Cuando utilice Tuning Studio para crear su experimento de sintonización, podrá desplegar directamente el modelo sintonizado resultante.
Antes de empezar
Debe configurar sus credenciales de tarea generando una clave API. Para obtener más información, consulte Gestión de credenciales de tareas.
Procedimiento
Para desplegar un modelo ajustado, realice los pasos siguientes:
En la pestaña Activos del proyecto, haga clic en el tipo de activo Experimentos.
Pulse para abrir el experimento de ajuste para el modelo que desea desplegar.
En la lista Modelos ajustados , busque el experimento de ajuste completado y, a continuación, pulse Nuevo despliegue.
Asigne un nombre al modelo ajustado.
El nombre del experimento de ajuste se utiliza como nombre de modelo ajustado si no lo cambia. El nombre tiene un número detrás entre paréntesis, que cuenta los despliegues. El número se inicia en uno y se incrementa en uno cada vez que se despliega este experimento de ajuste.
Opcional: añada una descripción y etiquetas.
Para el Contenedor de despliegue, elija una de las siguientes opciones:
- Este proyecto: Despliega el modelo sintonizado y lo añade a tu proyecto donde puedes probar el modelo sintonizado. Puede promover el despliegue del modelo ajustado a un espacio de despliegue en cualquier momento. Elija esta opción si desea realizar más pruebas del modelo ajustado antes de utilizarlo en producción.
- Espacio de despliegue: Promueve el modelo sintonizado a un espacio de despliegue y despliega el modelo sintonizado. Un espacio de despliegue está separado del proyecto donde crea el activo. Esta separación le permite promover activos de varios proyectos a un espacio y desplegar activos en más de un espacio. Elija esta opción cuando el modelo ajustado esté listo para ser promocionado para su uso en producción.
Para obtener más información sobre esta opción, consulte Uso de un espacio de despliegue.
Consejo: Seleccione la opción de ver después de crear para poder encontrar fácilmente su modelo ajustado una vez finalizado el proceso de despliegue.Pulse Desplegar.
Una vez desplegado el modelo ajustado, se almacena una copia del mismo en el proyecto como activo del modelo.
Utilizar un espacio de despliegue
Cuando se elige un espacio de despliegue como contenedor para el modelo ajustado, éste se promueve a un espacio de despliegue y, a continuación, se despliega. Un espacio de despliegue está asociado con los siguientes servicios que utiliza para desplegar activos:
tiempo de ejecución de watsonx.ai: Un producto con herramientas y servicios que puede utilizar para crear, entrenar y desplegar modelos de aprendizaje automático. Este servicio aloja el modelo convertido.
IBM Cloud Object Storage: Una plataforma segura para almacenar datos estructurados y no estructurados. Su activo de modelo desplegado se almacena en un Cloud Object Storage bucket que está asociado a su proyecto.
Para obtener más información, consulte Espacios de despliegue.
Para utilizar un espacio de despliegue, siga estos pasos:
Después de elegir Espacio de despliegue como contenedor de despliegue, en el campo Espacio de despliegue de destino, elija un espacio de despliegue.
El espacio de despliegue debe estar asociado con una instancia de aprendizaje automático que esté en la misma cuenta que el proyecto donde se ha creado el modelo ajustado.
Si no tiene un espacio de despliegue, elija Crear un nuevo espacio de desplieguey, a continuación, siga los pasos de Creación de espacios de despliegue.
En el campo Nombre de servicio de despliegue , añada una etiqueta para el despliegue.
El nombre de servicio se utiliza en el URL para el punto final de la API que identifica su implementación. La adición de un nombre es útil porque el nombre legible por el usuario que añade sustituye a un ID largo generado por el sistema que se asigna de otro modo.
El nombre de servicio también abstrae el despliegue de sus detalles de instancia de servicio. Las aplicaciones pueden hacer referencia a este nombre que permite cambiar la instancia de servicio subyacente sin afectar a los usuarios.
El nombre puede tener hasta 36 caracteres. Los caracteres soportados son [a-z,0-9, _].
El nombre debe ser exclusivo en la región de IBM Cloud . Es posible que se le solicite que cambie el nombre de servicio si el nombre que elija ya está en uso.
Recuperación del punto final de despliegue del modelo
Siga estos pasos para recuperar el endpoint URL para el despliegue de su modelo sintonizado:
- En la pestaña Despliegues de su proyecto o espacio de despliegue, haga clic en el nombre del despliegue.
- En la pestaña Referencia de la API, encontrará los enlaces a los puntos finales privados y públicos y fragmentos de código que puede utilizar para incluir los detalles de los puntos finales en una aplicación.
Necesita el punto final del modelo URL para acceder al despliegue desde sus aplicaciones.
Próximos pasos
Después de desplegar un modelo ajustado, puede probar su modelo inferenciándolo. Puede gestionar el despliegue de su modelo actualizando, ampliando o eliminando los detalles del despliegue.
Más información
- Modelos de base de afinación
- Inferencia de modelos sintonizados
- Seguridad y privacidad para modelos de base
Tema principal: Implementación de activos de modelos de base