0 / 0
Volver a la versión inglesa de la documentación
Ajuste de un foundation model
Última actualización: 28 nov 2024
Ajuste de un foundation model

Para sintonizar un ' foundation model' , cree un experimento de sintonización que guíe al ' foundation model ' para que devuelva la salida que desea en la forma que desea.

Requisitos

El Tuning Studio no está disponible con todos los planes ni en todos los centros de datos. Los modelos de base disponibles para el ajuste en Tuning Studio también pueden variar según el centro de datos. Para obtener más información, consulte watsonx.ai Planes de tiempo de ejecución y disponibilidad regional para servicios y funciones.

Normalmente, Tuning Studio está disponible desde un proyecto que se crea para ti automáticamente cuando te registras en watsonx.ai. El proyecto se denomina recinto de pruebas y puede utilizarlo para empezar a probar y personalizar modelos base.

Si no tiene un proyecto, cree uno. En el menú principal, expanda Proyectosy, a continuación, pulse Todos los proyectos.

  1. Pulse Nuevo proyecto.

  2. Asigne un nombre al proyecto y, a continuación, añada opcionalmente una descripción.

    Para obtener más información sobre las opciones de proyecto, como la creación de informes o el registro, consulte Creación de un proyecto.

  3. Pulse Crear.

Antes de empezar

Toma decisiones sobre las siguientes opciones de ajuste:

  • Encuentre el foundation model que mejor se adapte a su caso de uso. Véase Elegir un foundation model para afinar.
  • Cree un conjunto de solicitudes de ejemplo que sigan el patrón que genera los mejores resultados basándose en el trabajo de ingeniería de solicitud. Véase Formatos de datos.

Afinar un foundation model

En la página de inicio dewatsonx.ai, elige tu proyecto y, a continuación, haz clic en Nuevo activo > Ajustar un foundation model con datos etiquetados.

  1. Asigne un nombre al experimento de ajuste.

  2. Opcional: añada una descripción y etiquetas. Añada una descripción como recordatorio para sí mismo y para ayudar a los colaboradores a comprender el objetivo del modelo sintonizado. La asignación de una etiqueta le proporciona una forma de filtrar los activos de ajuste más adelante para mostrar sólo los activos asociados a una etiqueta.

  3. Pulse Crear.

  4. Haga clic en Seleccionar un foundation model para elegir el foundation model que desea ajustar.

    Haga clic en una ficha para ver una tarjeta de modelo con detalles sobre el foundation model. Cuando encuentre el foundation model que desea utilizar, haga clic en Seleccionar.

    Para más información, consulte Elegir un foundation model para afinar.

  5. Elija cómo inicializar la solicitud desde las siguientes opciones:

    Text
    Utiliza el texto que especifique.
    RANDOM
    Utiliza valores que se generan automáticamente como parte del experimento de ajuste.

    Estas opciones están relacionadas con el método de ajuste de solicitud para ajustar modelos. Para obtener más información sobre cómo afecta cada opción al experimento de ajuste, consulte Cómo funciona el ajuste de solicitud.

  6. Necesario sólo para el método de inicialización Texto: añada el texto de inicialización que desea incluir con la solicitud.

    • Para una tarea de clasificación, proporcione una instrucción que describa lo que desea clasificar y liste las etiquetas de clase que se van a utilizar. Por ejemplo, Clasifique si la opinión de cada comentario es Positiva o Negativa.
    • Para una tarea generativa, describa lo que desea que proporcione el modelo en la salida. Por ejemplo, Haz el caso para permitir que los empleados trabajen desde casa unos días a la semana.
    • Para una tarea de resumen, proporcione una instrucción como, por ejemplo, Resumir los puntos principales de una transcripción de reunión.
  7. Elija un tipo de tarea.

    Elija el tipo de tarea que más se ajuste a lo que desea que haga el modelo:

    Clasificación
    Predice etiquetas categóricas a partir de características. Por ejemplo, dado un conjunto de comentarios de cliente, es posible que desee etiquetar cada sentencia como una pregunta o un problema. Al separar los problemas del cliente, puede encontrarlos y abordarlos más rápidamente. Este tipo de tarea se encarga de la clasificación de una sola etiqueta.
    Generación
    Genera texto. Por ejemplo, escribe un correo electrónico promocional.
    Resumen
    Genera texto que describe las ideas principales que se expresan en un cuerpo de texto. Por ejemplo, resume un artículo de investigación.

    Sea cual sea la tarea que elija, la entrada se envía al foundation model subyacente como un tipo de solicitud generativa durante el experimento. Para las tareas de clasificación, los nombres de clase se tienen en cuenta en las solicitudes que se utilizan para ajustar el modelo. A medida que evolucionan los modelos y los métodos de ajuste, es probable que se añadan mejoras específicas de las tareas que puede aprovechar si las tareas se representan con precisión.

  8. Requerido sólo para tareas de clasificación: En el campo Salida de clasificación, añada las etiquetas de clase que desea que el modelo utilice de una en una.

    Importante: especifique las mismas etiquetas que se utilizan en los datos de entrenamiento.

    Durante el experimento de ajuste, la información de etiqueta de clase se envía junto con los ejemplos de entrada de los datos de entrenamiento.

  9. Añada los datos de entrenamiento que se utilizarán para ajustar el modelo. Puede cargar un archivo o utilizar un activo del proyecto.

    Para ver ejemplos de cómo formatear el archivo, expanda ¿Cómo deben ser los datos?, y, a continuación, pulse Vista previa de plantilla. Puede copiar o descargar una de las plantillas de datos para rellenarla con sus propios datos.

    Para más información, consulte Formatos de datos.

  10. Opcional: Si desea limitar el tamaño de los ejemplos de entrada o salida que se utilizan durante el entrenamiento, ajuste el número máximo de señales permitidas.

    Expanda ¿Cómo deben ser los datos?, y, a continuación, desplácese para ver los campos Número máximo de señales de entrada y Número máximo de señales de salida . Arrastre los controles deslizantes para cambiar los valores. Limitar el tamaño puede reducir el tiempo que se tarda en ejecutar el experimento de ajuste. Para obtener más información, consulte Control del número de señales utilizadas.

  11. Opcional: Pulse Configurar parámetros para editar los parámetros utilizados por el experimento de ajuste.

    La ejecución de ajuste se configura con valores de parámetro que representan un buen punto de partida para ajustar un modelo. Puede ajustarlos si lo desea.

    Para obtener más información sobre los parámetros disponibles y lo que hacen, consulte Ajuste de parámetros.

    Después de cambiar los valores de parámetro, pulse Guardar.

  12. Pulse Iniciar ajuste.

Empieza el experimento de ajuste. Puede tardar de unos minutos a unas horas en función del tamaño de los datos de entrenamiento y de la disponibilidad de los recursos de cálculo. Cuando finaliza el experimento, el estado se muestra como completado.

Un activo de modelo ajustado no se crea hasta después de crear un despliegue a partir de un experimento de ajuste completado. Para obtener más información, consulte Despliegue de un modelo ajustado.

Control del número de señales utilizadas

Para los modelos de lenguaje natural, las palabras se convierten en señales. 256 tokens es igual a aproximadamente 130-170 palabras. 128 señales es igual a aproximadamente 65-85 palabras. Sin embargo, los números de señal son difíciles de estimar y pueden diferir según el modelo. Para obtener más información, consulte Señales y señalización.

Puede cambiar el número de tokens que se permiten en la entrada y salida del modelo durante un experimento de ajuste de avisos.

Tabla 1: Parámetros de número de señal
Nombre de parámetro Valor predeterminado Opciones de valor Opciones de valor solo para flan-t5-xl-3b
Número máximo de tokens de entrada 256 1-1024 1-256
Máximo de tokens de salida 128 1-512 1-128

Cuanto mayor sea el número de señales de entrada y salida permitidas, más tiempo tardará en ajustar el modelo. Utilice el número más pequeño de señales en los ejemplos que es posible utilizar pero que sigue representando el caso de uso correctamente.

Ya tiene algún control sobre el tamaño de entrada. El texto de entrada que se utiliza durante un experimento de ajuste procede de los datos de entrenamiento. Por lo tanto, puede gestionar el tamaño de entrada manteniendo las entradas de ejemplo en una longitud establecida. Sin embargo, es posible que esté obteniendo datos de entrenamiento no organizados de otro equipo o proceso. En ese caso, puede utilizar el control deslizante Número máximo de señales de entrada para gestionar el tamaño de entrada. Si establece el parámetro en 200 y los datos de entrenamiento tienen una entrada de ejemplo con 1.000 señales, por ejemplo, el ejemplo se trunca. Sólo se utilizan las 200 primeras señales de la entrada de ejemplo.

El valor Número máximo de señales de salida es importante porque controla el número de señales que el modelo puede generar como salida en el momento del entrenamiento. Puede utilizar el graduador para limitar el tamaño de salida, lo que ayuda al modelo a generar una salida concisa.

Sugerencia: Para las tareas de clasificación, la minimización del tamaño de la salida es una buena forma de forzar que un modelo generativo devuelva sólo la etiqueta de clase, sin repetir el patrón de clasificación en la salida.

Evaluación del experimento de ajuste

Cuando finaliza el experimento, se visualiza un gráfico de función de pérdida que ilustra la mejora en la salida del modelo a lo largo del tiempo. Las épocas se muestran en el eje X y una medida de la diferencia entre los resultados pronosticados y reales por época se muestra en el eje Y. El valor que se muestra por época se calcula a partir del valor de gradiente promedio de todos los pasos de acumulación en la época.

Para obtener más información sobre cómo evaluar los resultados, consulte Evaluación de los resultados de un experimento de ajuste.

Cuando esté satisfecho con los resultados del experimento de ajuste, despliegue el foundation model ajustado. Para obtener más información, consulte Despliegue de un modelo ajustado.

Volver a ejecutar un experimento de ajuste

Para volver a ejecutar un experimento de ajuste, realice los pasos siguientes:

  1. En la página Activos del proyecto, filtre los activos por el tipo de activo Ajuste de experimentos .
  2. Busque y abra el activo de experimento de ajuste y, a continuación, pulse Nuevo modelo ajustado.

La función de pérdida para el experimento de ajuste se muestra en el mismo gráfico con las funciones de pérdida de ejecuciones anteriores para que pueda compararlas.

Muestra un gráfico de función de pérdida con datos de nueve ejecuciones de experimento en un gráfico

Más información

Tema principal: Tuning Studio

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información