0 / 0
Volver a la versión inglesa de la documentación
Cuándo ajustar un modelo de base
Última actualización: 16 abr 2024
Cuándo ajustar un modelo de base

Averigüe cuándo ajustar un modelo puede ayudarle a utilizar un modelo de base para lograr sus objetivos.

Ajuste un modelo de base cuando desee hacer lo siguiente:

  • Reduzca el coste de inferir a escala

    Los modelos de base más grandes suelen generar mejores resultados. Sin embargo, también son más caros de usar. Al ajustar un modelo, puede obtener resultados similares, a veces incluso mejores, de un modelo más pequeño que cuesta menos utilizar.

  • Obtener la salida del modelo para utilizar un determinado estilo o formato

  • Mejorar el rendimiento del modelo enseñando al modelo una tarea especializada

  • Generar salida en un formato fiable en respuesta a solicitudes de disparo cero

Cuándo no ajustar un modelo

El ajuste de un modelo no siempre es el enfoque adecuado para mejorar la salida de un modelo. Por ejemplo, el ajuste de un modelo no puede ayudarle a hacer lo siguiente:

  • Mejorar la precisión de las respuestas en la salida del modelo

    Si está utilizando un modelo de base para la recuperación de hechos en un escenario de respuesta a preguntas, el ajuste mejorará marginalmente la precisión de la respuesta. Para obtener respuestas de hechos, debe proporcionar información de hechos como parte de la entrada al modelo. El ajuste se puede utilizar para ayudar a que las respuestas de hechos generadas se ajusten a un formato que un proceso en sentido descendente de un flujo de trabajo pueda utilizar más fácilmente. Para obtener más información sobre los métodos para devolver respuestas de hechos, consulte Retreival-augmented generation.

  • Obtener el modelo para utilizar un vocabulario específico en su salida de forma coherente

    Los modelos de lenguaje grandes que se entrenan en grandes cantidades de datos formulan un vocabulario basado en ese conjunto inicial de datos. Puede introducir términos significativos en el modelo a partir de los datos de entrenamiento que utiliza para ajustar el modelo. Sin embargo, es posible que el modelo no utilice estos términos preferidos de forma fiable en su salida.

  • Enseñe un modelo de base para realizar una tarea completamente nueva

    Experimentar con la ingeniería rápida es un primer paso importante porque le ayuda a comprender el tipo de salida que un modelo de base es y no es capaz de generar. Puede utilizar el ajuste para ajustar, adaptar y dar forma a la salida que un modelo de base puede devolver.

Más información

Tema principal: Tuning Studio

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información