Por lo general, el Tuning Studio está disponible desde un proyecto que se crea automáticamente para usted cuando se registra en watsonx.ai. El proyecto se llama sandbox y puede utilizarlo para empezar a probar y personalizar los modelos de bases.
Si no tienes un proyecto, crea uno. En el menú principal, expanda Proyectos y, a continuación, haga clic en Todos los proyectos.
Pulse Nuevo proyecto.
Nombre el proyecto y, opcionalmente, añada una descripción.
Para obtener más información sobre las opciones de proyecto, como la creación de informes o el registro, consulte Creación de un proyecto.
Pulse Crear.
Tome decisiones sobre las siguientes opciones de sintonización:
Cree un conjunto de ejemplos de mensajes que sigan el patrón que genere los mejores resultados en función de su trabajo de ingeniería de mensajes. Ver Formatos de datos.
Ajustar un modelo de base
Copy link to section
En la página de inicio de watsonx.ai, elija su proyecto y haga clic en Nuevo activo > Tune a foundation model with labeled data (Ajustar un modelo de cimientos con datos etiquetados ).
Nombre el experimento de afinación.
Opcional : Añadir una descripción y etiquetas. Añada una descripción como recordatorio para usted y para ayudar a los colaboradores a comprender el objetivo del modelo ajustado. Asignar una etiqueta le permite filtrar sus activos de sintonía más adelante para mostrar solo los activos asociados con una etiqueta.
Pulse Crear.
Haz clic en Seleccionar un modelo de base para elegir el modelo de base que deseas ajustar.
Haga clic en un mosaico para ver una tarjeta de modelo con detalles sobre el modelo de base. Cuando encuentre el modelo de base que desea utilizar, haga clic en Seleccionar.
Elija cómo inicializar el aviso entre las siguientes opciones:
Text
Utiliza el texto que usted especifique.
RANDOM
Utiliza valores que se generan para usted como parte del experimento de ajuste.
Estas opciones están relacionadas con el método de ajuste rápido para los modelos de ajuste. Para obtener más información sobre cómo afecta cada opción al experimento de sintonización, consulte Cómo funciona la sintonización rápida.
Obligatorio únicamente para el método de inicialización de texto : agregue el texto de inicialización que desea incluir con el mensaje.
Para una tarea de clasificación, dé una instrucción que describa lo que quiere clasificar y enumere las etiquetas de clase que se utilizarán. Por ejemplo, clasifique si el sentimiento de cada comentario es positivo o negativo.
Para una tarea generativa, describa lo que quiere que el modelo proporcione en el resultado. Por ejemplo, defienda la posibilidad de que los empleados trabajen desde casa algunos días a la semana.
Para una tarea de resumen, dé una instrucción como, Resumir los puntos principales de una transcripción de una reunión.
Elija un tipo de tarea.
Elija el tipo de tarea que más se acerque a lo que quiere que haga la modelo:
Clasificación
Predice etiquetas categóricas a partir de características. Por ejemplo, dado un conjunto de comentarios de clientes, es posible que desee etiquetar cada afirmación como una pregunta o un problema. Al separar los problemas de los clientes, puede encontrarlos y solucionarlos más rápidamente. Este tipo de tarea gestiona la clasificación de etiquetas únicas.
Generación
Genera texto. Por ejemplo, escribe un correo electrónico promocional.
Resumen
Genera texto que describe las ideas principales expresadas en un cuerpo de texto. Por ejemplo, resume un trabajo de investigación.
Sea cual sea la tarea que elija, la entrada se envía al modelo de base subyacente como un tipo de solicitud generativa durante el experimento. Para las tareas de clasificación, los nombres de las clases se tienen en cuenta en las indicaciones que se utilizan para ajustar el modelo. A medida que evolucionan los modelos y los métodos de ajuste, es probable que se añadan mejoras específicas para cada tarea que usted podrá aprovechar si las tareas se representan con precisión.
Solo necesario para tareas de clasificación : en el campo de salida de Clasificación, agregue las etiquetas de clase que desea que el modelo utilice de una en una.
Importante : Especifique las mismas etiquetas que se utilizan en sus datos de entrenamiento.
Durante el experimento de ajuste, la información de la etiqueta de clase se envía junto con los ejemplos de entrada de los datos de entrenamiento.
Añadir los datos de entrenamiento que se utilizarán para ajustar el modelo. Puede cargar un archivo o utilizar un recurso de su proyecto.
Para ver ejemplos de cómo dar formato a su archivo, expanda ¿Cómo deberían verse sus datos?, y, a continuación, haga clic en Vista previa de plantilla. Puede copiar o descargar una de las plantillas de datos para rellenarla con sus propios datos.
Opcional : Si desea limitar el tamaño de los ejemplos de entrada o salida que se utilizan durante la formación, ajuste el número máximo de fichas permitidas.
Expandir ¿Cómo deberían ser sus datos?, y, a continuación, desplácese para ver los campos Número máximo de fichas de entrada y Número máximo de fichas de salida. Arrastre los controles deslizantes para cambiar los valores. Limitar el tamaño puede reducir el tiempo que se tarda en ejecutar el experimento de sintonización. Para más información, consulte Controlar el número de tokens utilizados.
Opcional : Haga clic en Configurar parámetros para editar los parámetros que utiliza el experimento de sintonización.
La ejecución de ajuste se configura con valores de parámetros que representan un buen punto de partida para ajustar un modelo. Puedes ajustarlos si quieres.
Para obtener más información sobre los parámetros disponibles y su función, consulte Parámetros de ajuste.
Después de cambiar los valores de los parámetros, haga clic en Guardar.
Haga clic en Iniciar sintonización.
Comienza el experimento de sintonización. Puede tardar desde unos minutos hasta unas horas, dependiendo del tamaño de los datos de entrenamiento y de la disponibilidad de recursos informáticos. Cuando el experimento haya finalizado, el estado se mostrará como completado.
Un activo de modelo ajustado no se crea hasta después de crear una implementación a partir de un experimento de ajuste completado. Para obtener más información, consulte Implementación de un modelo ajustado.
Controlar el número de fichas utilizadas
Copy link to section
Para los modelos de lenguaje natural, las palabras se convierten en símbolos. 256 tokens equivalen a aproximadamente 130-170 palabras. 128 tokens equivalen a aproximadamente 65-85 palabras. Sin embargo, los números de token son difíciles de estimar y pueden diferir según el modelo. Para obtener más información, consulte Tokens y tokenización.
Puede cambiar el número de fichas permitidas en la entrada y salida del modelo durante un experimento de ajuste de la respuesta.
Tabla 1: Parámetros del número de token
Nombre de parámetro
Valor predeterminado
Opciones de valor
Opciones de valor solo para flan-t5-xl-3b
Número máximo de tokens de entrada
256
1-1024
1-256
Máximo de tokens de salida
128
1-512
1-128
Cuanto mayor sea el número de fichas de entrada y salida permitidas, más tiempo se tardará en ajustar el modelo. Utiliza el menor número posible de símbolos en tus ejemplos, pero que sigan representando adecuadamente tu caso de uso.
Ya tienes cierto control sobre el tamaño de entrada. El texto de entrada que se utiliza durante un experimento de afinación proviene de sus datos de entrenamiento. Por lo tanto, puede gestionar el tamaño de entrada manteniendo las entradas de ejemplo en una longitud determinada. Sin embargo, es posible que esté recibiendo datos de formación no seleccionados de otro equipo o proceso. En ese caso, puede utilizar el control deslizante de tokens de entrada máximos para gestionar el tamaño de entrada. Si establece el parámetro en 200 y los datos de entrenamiento tienen una entrada de ejemplo con 1000 tokens, por ejemplo, el ejemplo se trunca. Solo se utilizan los primeros 200 tokens de la entrada de ejemplo.
El valor de los tokens de salida máximos es importante porque controla el número de tokens que el modelo puede generar como salida en el momento del entrenamiento. Puede utilizar el control deslizante para limitar el tamaño de salida, lo que ayuda al modelo a generar una salida concisa.
Consejo : Para las tareas de clasificación, minimizar el tamaño de la salida es una buena forma de forzar a un modelo generativo a devolver solo la etiqueta de clase, sin repetir el patrón de clasificación en la salida.
Evaluación del experimento de afinación
Copy link to section
Cuando el experimento finaliza, se muestra un gráfico de la función de pérdida que ilustra la mejora en la salida del modelo a lo largo del tiempo. Las épocas se muestran en el eje x y una medida de la diferencia entre los resultados previstos y reales por época se muestra en el eje y. El valor que se muestra por época se calcula a partir del valor de gradiente medio de todos los pasos de acumulación en la época.
Cuando esté satisfecho con los resultados del experimento de ajuste, implemente el modelo de base ajustado. Para obtener más información, consulte Implementación de un modelo ajustado.
Volver a realizar un experimento de sintonización
Copy link to section
Para volver a ejecutar un experimento de sintonización, complete los siguientes pasos:
Desde la página Activos del proyecto, filtra tus activos por el tipo de activo Experimentos de sintonización.
Busque y abra su activo de experimento de afinación y, a continuación, haga clic en Nuevo modelo afinado.
La función de pérdida para el experimento de sintonización se muestra en el mismo gráfico con las funciones de pérdida de ejecuciones anteriores para que pueda compararlas.
Además del activo del modelo de base sintonizado, el experimento de sintonización en sí se guarda como un activo. Si los resultados de una ejecución anterior del experimento son mejores que los de una ejecución posterior, puede volver a la ejecución anterior del experimento y utilizar el activo de modelo resultante para crear una nueva implementación de modelo ajustada.