0 / 0
Volver a la versión inglesa de la documentación

Mejora de un experimento de sintonización rápida

Última actualización: 04 mar 2025
Mejora de un experimento de sintonización rápida

Realice cambios en su experimento de ajuste de avisos para mejorar los resultados.

Hay disponible un cuaderno Python de ejemplo denominado Utilizar watsonx.aito para ajustar el modelo IBM granite-13b-instruct-v2 con el documento de satisfacción del cliente de Car Rental Company que contiene código para solicitar el ajuste de los modelos base en watsonx.ai. El cuaderno de ejemplo tiene secciones para optimizar los parámetros del experimento y para inferir el modelo ajustado. Para obtener más información, consulte Ajuste de un modelo de base utilizando un cuaderno de Python.

Ajuste de parámetros de ajuste

Cuando finaliza la ejecución de un experimento de ajuste, se visualiza un gráfico de función de pérdida. Una función de pérdida mide la diferencia entre los resultados previstos y reales con cada ejecución de entrenamiento. Un experimento de ajuste exitoso da como resultado una función de pérdida que tiene una curva inclinada hacia abajo.

Donde la medida de pérdida desciende y los niveles desactivados se denomina convergencia. Desea que la curva descienda, o converja, y que el extremo de cola de la curva se acerque lo más posible a 0 porque significa que los resultados pronosticados son lo más parecidos posibles a los resultados de los datos de entrenamiento.

Si la función de pérdida para su experimento se parece a una cordillera con múltiples picos, la pérdida nunca converge, o la pérdida converge, pero permanece en un número mucho más alto que cero, ajuste sus parámetros de ajuste.

Puede configurar los valores de los parámetros en Tuning Studio o utilizar el cuaderno de muestras. El cuaderno de ejemplo tiene pasos que le ayudan a encontrar los mejores valores para utilizar para los parámetros de ajuste, que a veces se denomina optimización de hiperparámetros. Para obtener más información, consulte Utilización del cuaderno para optimizar los valores de los parámetros de ajuste.

En la tabla siguiente se describen los resultados comunes del experimento de ajuste y se listan las acciones que pueden mejorar los resultados.

Tabla 1: Acciones para abordar fallos comunes del experimento de ajuste
Gráfico de función de pérdida Motivo Acciones a intentar
La curva de pérdida es plana y nunca baja
La curva de pérdidas es plana y nunca desciende.
El ajuste no mejora mucho los resultados. • Aumente la tasa de aprendizaje (en 10x) para que el experimento realice ajustes más drásticos en el vector de solicitud.
La curva de pérdida desciende pero se establece demasiado alta
La curva de pérdidas desciende pero la cola se asienta en una cifra demasiado alta.
El ajuste no está mejorando los resultados en la medida de lo posible. • Aumente la tasa de aprendizaje (por 5x) para que el experimento realice ajustes más grandes en el vector de solicitud.
La curva de pérdida desciende pero no se acerca lo más posible a cero
La curva de pérdidas cae, luego disminuye de forma constante pero nunca se estabiliza.
El entrenamiento finalizó antes de que el modelo estuviera totalmente ajustado. • Aumentar el número de épocas para dar al modelo más tiempo para aprender.
La curva de pérdida sube y luego vuelve a bajar, pero nunca baja lo suficiente
La curva de pérdidas sube y luego baja, pero nunca lo suficiente.
El entrenamiento es inestable porque la alta tasa de aprendizaje está haciendo que el vector de solicitud cambie demasiado. - Disminuya la tasa de aprendizaje (en 10x) para realizar ajustes más pequeños en el vector de indicaciones.

Para obtener más información sobre cómo cambiar los parámetros de sintonización y volver a ejecutar un experimento de sintonización, consulte Tuning Studio.

Resolución de problemas de calidad de datos en salida de modelo ajustada

Sabe que ha terminado de ajustar un modelo cuando puede enviar solicitudes de captura cero al modelo ajustado y obtener las salidas que esperaba.

En la tabla siguiente se describen algunos problemas comunes de calidad de datos de entrenamiento y se listan las acciones que puede realizar para abordarlos.

Tabla 2: Acciones para abordar fallos de datos de formación
Resultado Motivo Acciones a intentar
Las salidas de modelo ajustadas no coinciden con el contenido y el formato de los ejemplos de salida de los datos de entrenamiento No hay suficientes ejemplos de datos de entrenamiento Aumente el tamaño de los datos de entrenamiento.
Las salidas de modelo ajustadas están incompletas El proceso de ajuste no está utilizando los ejemplos que cree que está utilizando Observe la duración de los ejemplos de entrada y salida de datos de entrenamiento. El número máximo de señales de entrada permitido es 256 y el número máximo de señales de salida permitido es 128. Los ejemplos que son más largos que la longitud máxima permitida se truncan.
Faltan etiquetas de clasificación en una tarea de clasificación No hay suficientes ejemplos de cada tipo de clase para una tarea de clasificación Añada más ejemplos de cada tipo de clase que desee que reconozca el modelo.
Faltan extracciones de texto en una tarea de extracción No hay suficientes ejemplos de cada tipo de entidad para una tarea de extracción Añada más ejemplos de cada tipo de entidad que desee que reconozca el modelo.
Etiquetas de clase inexactas o extracciones de texto de tipo de entidad Contexto insuficiente para elegir la clase o el tipo de entidad correctos • Añada un número igual de ejemplos para cada tipo.
• Revise las clases o entidades que desea que el modelo identifique o extraiga para asegurarse de que son distintas entre sí.

Tema principal: Evaluación de los resultados de los experimentos de sintonización