Desarrollo de soluciones generativas de IA con modelos base
Puede desarrollar soluciones de IA generativas con modelos base en IBM watsonx.ai. Puede crear avisos para generar, clasificar, resumir o extraer contenido de su contenido de entrada. Elija entre los modelos de IBM o los modelos de código abierto. Puede ajustar los modelos de base para personalizar la salida de la solicitud u optimizar el rendimiento de la inferencia.
Capacidades de IA generativa
Con watsonx.ai, puede crear soluciones de IA generativa que incluyan las siguientes capacidades y recursos.
- SOLICITANDO
- Construir indicaciones que instruyan a un modelo de base para generar una respuesta. Puede chatear con documentos y otros soportes, incluir variables para reutilizar avisos, eliminar contenidos nocivos y controlar otros ajustes de avisos y modelos.
- Consulte las instrucciones de construcción.
- IA agéntica
- Construir flujos de trabajo para que el modelo base funcione como un agente que controla el flujo de interacción con el usuario.
- Consulte Creación de flujos de trabajo basados en agentes con la API de chat.
- Generación aumentada por recuperación
- Construya un patrón RAG para fundamentar el modelo en hechos de sus documentos. Puede personalizar su patrón RAG para extraer texto de los documentos, crear índices vectoriales y jerarquizar el contenido recuperado. Puede automatizar la búsqueda de un patrón RAG optimizado, con calidad de producción y basado en sus datos y casos de uso.
- Véase Generación aumentada por recuperación.
- Previsiones
- Previsión de valores futuros a partir de datos históricos de series temporales.
- Véase Previsión de valores futuros.
- Modelos base
- Watsonx.ai tiene una gama de modelos de bases de maquillaje que puedes probar. De lo contrario, puede seleccionar un modelo de despliegue a petición o importar y desplegar un modelo personalizado.
- Consulte Modelos de cimientos compatibles.
- Ajuste de modelos
- Ajuste un modelo de cimentación más pequeño para obtener resultados comparables a los de modelos más grandes de la misma familia de modelos.
- Véase Ajuste de los modelos de cimentación.
- Evaluaciones
- Evalúe y compare sus activos de IA generativa con métricas cuantitativas y criterios personalizables que se adapten a sus casos de uso.
- Véase Evaluación de los modelos de IA.
Para obtener consejos sobre la planificación de su solución de IA generativa, consulte Planificación de una solución de IA.
Formas de trabajar
Puede escribir código para su solución de IA generativa. Para obtener una lista de tareas y API, consulte Codificación de soluciones de IA generativa.
Puede trabajar en una experiencia sin código o de bajo código con herramientas en la interfaz de usuario:
Arquitectura de modelo de base
Los modelos de base son grandes modelos de IA que tienen miles de millones de parámetros y se entrenan en terabytes de datos. Los modelos de base pueden realizar diversas tareas, incluyendo texto, código o generación de imágenes, clasificación, conversación, etc. Los grandes modelos lingüísticos son un subconjunto de los modelos básicos que pueden realizar tareas relacionadas con el texto y el código.
Los modelos de base representan una arquitectura de modelo fundamentalmente diferente y su finalidad para los sistemas de IA. El siguiente diagrama ilustra la diferencia entre los modelos tradicionales de IA de aprendizaje automático y los modelos básicos de IA generativa.
Como se muestra en el diagrama, los modelos de IA tradicionales se especializan en tareas específicas. La mayoría de los modelos de IA tradicionales se crean utilizando machine learning, que requiere un conjunto de datos grande, estructurado y bien etiquetado que englobe una tarea específica que desea abordar. A menudo, estos conjuntos de datos deben obtenerse, recopilarse y etiquetarse a mano, una tarea que requiere personal con conocimientos en la materia y lleva tiempo. Una vez entrenado, un modelo de IA tradicional puede hacer bien una sola tarea. El modelo de IA tradicional utiliza lo que aprende de los patrones en los datos de entrenamiento para predecir los resultados en datos desconocidos. Puede crear modelos de aprendizaje automático para sus casos de uso específicos con herramientas como AutoAI y cuadernos Jupyter y, a continuación, desplegarlos.
En cambio, los modelos de fundamentos se entrenan en conjuntos de datos grandes, diversos y sin etiquetar, y pueden utilizarse para muchas tareas diferentes. Los modelos de base se utilizaron por primera vez para generar texto calculando la palabra siguiente más probable en las tareas de traducción de lenguaje natural. Sin embargo, los proveedores de modelos están aprendiendo que, cuando se les solicita con la entrada correcta, los modelos de base pueden realizar bien otras tareas. En lugar de crear sus propios modelos de base, utilice los modelos desplegados existentes y las solicitudes de ingeniería para generar los resultados que necesite.