0 / 0
Volver a la versión inglesa de la documentación
Desarrollo de soluciones generativas de IA con modelos base
Última actualización: 09 dic 2024
Desarrollo de soluciones generativas de IA con modelos base

Puede desarrollar soluciones de IA generativas con modelos base en IBM watsonx.ai. Puede crear avisos para generar, clasificar, resumir o extraer contenido del texto de entrada. Elija entre los modelos de IBM o los modelos de código abierto. Puede ajustar los modelos de base para personalizar la salida de la solicitud u optimizar el rendimiento de la inferencia.

Los modelos de base son grandes modelos de IA que tienen miles de millones de parámetros y se entrenan en terabytes de datos. Los modelos de base pueden realizar diversas tareas, incluyendo texto, código o generación de imágenes, clasificación, conversación, etc. Los modelos de lenguaje grandes son un subconjunto de modelos de base que pueden realizar tareas relacionadas con el texto y el código. Watsonx.ai tiene un rango de modelos de lenguaje grandes desplegados para que pueda intentarlo. Para obtener más detalles, consulte Modelos de base soportados.

Arquitectura de modelo de base

Los modelos de base representan una arquitectura de modelo fundamentalmente diferente y su finalidad para los sistemas de IA. El diagrama siguiente ilustra la diferencia entre los modelos de IA tradicionales y los modelos de base.

Comparación de modelos de IA tradicionales con modelos de base

Como se muestra en el diagrama, los modelos de IA tradicionales se especializan en tareas específicas. La mayoría de los modelos de IA tradicionales se crean utilizando machine learning, que requiere un conjunto de datos grande, estructurado y bien etiquetado que englobe una tarea específica que desea abordar. A menudo, estos conjuntos de datos deben ser obtenidos, ordenados y etiquetados a mano, un trabajo que requiere personas con conocimientos de dominio y toma tiempo. Una vez entrenado, un modelo de IA tradicional puede hacer bien una sola tarea. El modelo de IA tradicional utiliza lo que aprende de los patrones en los datos de entrenamiento para predecir los resultados en datos desconocidos. Puede crear modelos de aprendizaje automático para sus casos de uso específicos con herramientas como AutoAI y cuadernos Jupyter y, a continuación, desplegarlos.

Por el contrario, los modelos de base se entrenan en conjuntos de datos grandes, diversos y no etiquetados y se pueden utilizar para muchas tareas diferentes. Los modelos de base se utilizaron por primera vez para generar texto calculando la palabra siguiente más probable en las tareas de traducción de lenguaje natural. Sin embargo, los proveedores de modelos están aprendiendo que, cuando se les solicita con la entrada correcta, los modelos de base pueden realizar bien otras tareas. En lugar de crear sus propios modelos de base, utilice los modelos desplegados existentes y las solicitudes de ingeniería para generar los resultados que necesite.

Métodos de trabajo con modelos de base

Las posibilidades y aplicaciones de los modelos de base están empezando a ser descubiertas. Explore y valide casos de uso con modelos base en watsonx.ai para automatizar, simplificar y acelerar los procesos existentes o proporcionar valor de una forma nueva.

Puede interactuar con modelos de base de las siguientes maneras:

  • Diseñe directamente las instrucciones y los modelos de cimentación de inferencia desplegados mediante el Prompt Lab
  • Inferencia desplegada modelos de la fundación mediante programación utilizando la biblioteca Python o la API watsonx.ai
  • Ajuste los modelos de cimentación para que devuelvan resultados en un determinado estilo o formato mediante Tuning Studio

Más información

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información