0 / 0
Volver a la versión inglesa de la documentación
Métodos para ajustar modelos de base
Última actualización: 28 nov 2024
Métodos para ajustar modelos de base

Obtenga más información sobre los distintos métodos de ajuste y cómo funcionan.

Los modelos se pueden ajustar de las formas siguientes:

  • Ajuste fino: Utilizando el conocimiento previo del modelo base como punto de partida, el ajuste fino adapta el modelo ajustándolo con un conjunto de datos más pequeño y específico de la tarea. Este proceso cambia las ponderaciones de los parámetros de un modelo cuyas ponderaciones se establecieron mediante un entrenamiento previo para optimizar el modelo para una tarea.

    Nota: Actualmente no puedes ajustar con precisión los modelos de cimentación en watsonx.ai, pero puedes ajustarlos con prontitud.
  • Ajuste de solicitud: ajusta el contenido de la solicitud que se pasa al modelo para guiar al modelo para generar resultados que coincidan con un patrón que especifique. El foundation model subyacente y sus pesos de parámetros no se modifican. Sólo se altera la entrada de solicitud.

    Si bien el resultado del ajuste rápido es un nuevo activo de modelo ajustado, el modelo ajustado rápido simplemente agrega una capa de función que se ejecuta antes de que el foundation model subyacente procese la entrada. Cuando se ajusta un modelo de forma rápida, el foundation model subyacente no se modifica, lo que significa que se puede utilizar para abordar diferentes necesidades comerciales sin tener que volver a entrenarlo cada vez. Como resultado, reduce las necesidades de cálculo y los costes de inferencia.

Para comenzar, consulte Ajuste de un foundation model .

Cómo funciona el ajuste de solicitud

Los modelos de base son sensibles a la entrada que les proporciona. La entrada, o cómo solicita el modelo, puede introducir el contexto que el modelo utilizará para adaptar su salida generada. Solicitar ingeniería para encontrar la solicitud derecha a menudo funciona bien. Sin embargo, puede consumir mucho tiempo, ser propenso a errores y su eficacia puede estar restringida por la longitud de ventana de contexto permitida por el modelo subyacente.

La solicitud de ajuste de un modelo en Tuning Studio aplica el aprendizaje automático a la tarea de ingeniería de solicitud. En lugar de añadir palabras a la propia entrada, el ajuste de solicitud es un método para encontrar una secuencia de valores que, cuando se añade como prefijo al texto de entrada, mejora la capacidad del modelo para generar la salida que desee. Esta secuencia de valores se denomina vector de solicitud.

Normalmente, el modelo vectoriza las palabras de la solicitud. La vectorización es el proceso de convertir texto en señales y, a continuación, en números definidos por el simbolizador del modelo para identificar las señales. Por último, los ID de señal se codifican, lo que significa que se convierten en una representación de vector, que es el formato de entrada que espera la capa de inclusión del modelo. El ajuste de solicitud omite el proceso de vectorización de texto del modelo y, en su lugar, crea un vector de solicitud directamente. Este vector de solicitud modificable se concatena con el texto de entrada vectorizado y los dos se pasan como una entrada a la capa de inclusión del modelo. Los valores de este vector de solicitud específico afectan a las ponderaciones de inclusión de palabras establecidas por el modelo e influyen en las palabras que el modelo elige añadir a la salida.

Para encontrar los mejores valores para el vector de solicitud, ejecute un experimento de ajuste. Puede mostrar el tipo de salida que desea para una entrada correspondiente proporcionando al modelo pares de ejemplo de entrada y salida en los datos de entrenamiento. Con cada ejecución de entrenamiento del experimento, la salida generada se compara con la salida de datos de entrenamiento. Basándose en lo que aprende de las diferencias entre los dos, el experimento ajusta los valores en el vector de solicitud. Después de muchas ejecuciones a través de los datos de entrenamiento, el modelo busca el vector de solicitud que mejor funciona.

Puede optar por iniciar el proceso de entrenamiento proporcionando texto que el experimento vectoriza. O bien, puede dejar que el experimento utilice valores aleatorios en el vector de solicitud. De cualquier forma, a menos que los valores iniciales sean exactamente correctos, se cambiarán repetidamente como parte del proceso de entrenamiento. Proporcionar su propio texto de inicialización puede ayudar a que el experimento alcance un buen resultado más rápidamente.

El resultado del experimento es una versión ajustada del modelo subyacente. Puede enviar la entrada al modelo ajustado para la inferencia y el modelo genera la salida que sigue el patrón ajustado para.

Para obtener más información sobre el proceso de ajuste de avisos que se utiliza en Tuning Studio, consulte Flujo de trabajo de ajuste de avisos.

Más información

Tema padre: Tuning Studio

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información