En IBM watsonx.ai, puede utilizar modelos base de IBM creados con integridad y diseñados para la empresa.
La familia Granite de modelos de base de IBM incluye modelos de solo decodificador que pueden predecir y generar lenguaje de forma eficiente.
Los modelos se han creado con datos de confianza que tienen las características siguientes:
Procedente de conjuntos de datos de calidad en dominios como finanzas (SEC Filings), derecho (Free Law), tecnología (Stack Exchange), ciencia ( arXiv, DeepMind Matemáticas), literatura (Proyecto Gutenberg ( PG-19)), y más.
Cumple con los rigurosos estándares de gobierno y autorización de datos de IBM .
Se ha borrado el odio, el abuso y la blasfemia, la duplicación de datos y los URL incluidos en la lista de elementos bloqueados, entre otras cosas.
Los modelos de bases de datos en watsonx.ai admiten una amplia gama de casos de uso, tanto para lenguajes naturales como para lenguajes de programación. Para ver los tipos de tareas que estos modelos pueden hacer, revise y pruebe las indicaciones de muestra.
granite-3-2-8b-instruct
Copy link to section
Granite 3.2 Instruct es un modelo de base de contexto largo que se ajusta para mejorar las capacidades de razonamiento. La capacidad de razonamiento es configurable, lo que significa que puede controlar cuándo se aplica el razonamiento.
Uso
Capaz de realizar tareas generativas comunes, incluidas tareas relacionadas con el código, llamadas a funciones y diálogos multilingües. Se especializa en razonamiento y tareas de contexto largo, como resumir documentos largos o transcripciones de reuniones y responder a preguntas con respuestas que se basan en el contexto proporcionado por documentos largos.
Size
8 mil millones de parámetros
Nivel de precios API
Clase 12
Disponibilidad
Proporcionado por IBM implementado en hardware multiusuario.
Desarrollado sobre la base de Granite-3.1-8B-Instruct, el modelo se entrenó utilizando una combinación de conjuntos de datos de código abierto con licencia permisiva y datos sintéticos generados internamente diseñados para tareas de razonamiento.
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
Los modelos de base de la colección Granite Instruct pertenecen a la familia de modelos IBM Granite. Los modelos de base de granite-3-2b-instruct y granite-3-8b-instruct son Granite 3.1 Instruir a los modelos de base. Estos modelos se basan en iteraciones anteriores para proporcionar un mejor soporte para las tareas de codificación y funciones intrínsecas para los agentes.
Uso
Granite Instruct los modelos de base están diseñados para sobresalir en tareas de seguimiento de instrucciones, como resumen, resolución de problemas, traducción de textos, razonamiento, tareas de código, llamada de funciones y más.
Tamaños
2000 millones de parámetros
8 mil millones de parámetros
Nivel de precios API
2b: Clase C1
8b: Clase 12
Para obtener detalles sobre los precios, consulte la Tabla 2.
Disponibilidad
Proporcionado por IBM implementado en hardware multiusuario.
Los modelos de la Unidad de Respuesta Rápida ( Granite Instruct ) están entrenados con código escrito en 116 lenguajes de programación.
Información de ajuste de instrucciones
Los modelos de Granite Instruct están ajustados con precisión. Los modelos básicos de Granite Instruct , entrenados con más de 12 billones de fichas, con una combinación de datos de instrucciones de código abierto con licencia permisiva y de propiedad.
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
El modelo de base Granite 8b es un modelo base que pertenece a la familia de modelos IBM Granite. El modelo se entrena con 10 billones de tokens procedentes de diversos dominios, y luego se entrena con 2 billones de tokens de datos de alta calidad que se eligen cuidadosamente para mejorar el rendimiento del modelo en tareas específicas.
Uso
El modelo base de la base de datos de la Granite 3.0 es un modelo de referencia que puede personalizar para crear modelos especializados para escenarios de aplicación específicos.
Size
8 mil millones de parámetros
Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
Disponibilidad
Implementación bajo demanda para uso exclusivo.
Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 4096
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
IBM proporciona el modelo de base granite-7b-lab. El modelo de base de la Fundación de la Academia de Ciencias de Nueva York ( granite-7b-lab ) utiliza un novedoso método de ajuste de alineación de la investigación de la Universidad de Columbia ( IBM ). chatBots, La alineación a gran escala para el aprendizaje automático o el aprendizaje por refuerzo es un método para añadir nuevas habilidades a los modelos de base existentes mediante la generación de datos sintéticos para las habilidades y, a continuación, el uso de esos datos para ajustar el modelo de base.
Uso
Admite tareas de propósito general, como extracción, resumen, clasificación y más. Siga las pautas indicadas para obtener consejos sobre su uso. Para más información, consulte Solicitar un granite-7b-lab.
Size
7 mil millones de parámetros
Nivel de precios API
Para obtener detalles sobre los precios, consulte la Tabla 4.
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
El modelo de granite-8b-japanese es proporcionado por IBM. El modelo de la fundación granite-8b-japanese es una variante instructa inicializada a partir del modelo preentrenado Granite Base 8 Billion Japanese y está entrenado para comprender y generar texto japonés.
Uso
Útil para tareas de uso general en idioma japonés, como clasificación, extracción, preguntas y respuestas, y para la traducción de idiomas entre japonés e inglés.
Size
8 mil millones de parámetros
Nivel de precios API
Clase 1. Para obtener detalles sobre los precios, consulte la Tabla 2.
Disponibilidad
Proporcionado por IBM implementado en hardware multiusuario en el centro de datos de Tokio.
Implementación bajo demanda para uso exclusivo, excepto en el centro de datos de Fráncfort.
Longitud de la ventana de contexto (entrada + salida): 4096
Idiomas naturales admitidos
Inglés, japonés
Información de ajuste de instrucciones
La familia de modelos de aprendizaje automático ( Granite ) se entrena con conjuntos de datos relevantes para la empresa de cinco ámbitos: Internet, académico, código, legal y financiero. El modelo de aprendizaje profundo ( granite-8b-japanese ) se entrenó previamente con un billón de tokens de texto en inglés y un billón de tokens de texto en japonés ( 0.5 ).
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
El modelo de granite-13b-chat-v2 es proporcionado por IBM. Este modelo está optimizado para casos de uso de diálogo y funciona bien con agentes virtuales y aplicaciones de chat.
Uso : genera una salida de diálogo como un chatbot. Utiliza un formato de aviso específico para cada modelo. Incluye una palabra clave en su salida que puede utilizarse como secuencia de parada para producir respuestas sucintas. Siga las pautas indicadas para obtener consejos sobre su uso. Para más información, consulte Solicitar un granite-13b-chat-v2.
Size
13 mil millones de parámetros
Nivel de precios API
Clase 1. Para obtener detalles sobre los precios, consulte la Tabla 2 y la Tabla 4.
Longitud de la ventana de contexto (entrada + salida): 8192
Idiomas naturales admitidos
Inglés
Información de ajuste de instrucciones
La familia de modelos de aprendizaje automático ( Granite ) se entrena con conjuntos de datos relevantes para la empresa de cinco ámbitos: Internet, académico, código, legal y financiero. Los datos utilizados para entrenar los modelos se someten primero a revisiones de gobernanza de datos e IBM es y se les filtra el texto que está marcado por odio, abuso o blasfemia por el filtro HAP desarrollado por la Fundación contra la Difamación ( IBM ). IBM comparte información sobre los métodos de formación y los conjuntos de datos utilizados.
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
El modelo de granite-13b-instruct-v2 es proporcionado por IBM. Este modelo se entrenó con datos financieros de alta calidad y es un modelo de alto rendimiento en tareas financieras. Las tareas financieras evaluadas incluyen: proporcionar puntuaciones de sentimiento para transcripciones de llamadas sobre acciones y ganancias, clasificar titulares de noticias, extraer evaluaciones de riesgo crediticio, resumir textos financieros extensos y responder preguntas financieras o relacionadas con seguros.
Nota:Este modelo de base se puede ajustar utilizando el Tuning Studio.
Uso
Admite tareas de extracción, resumen y clasificación. Genera resultados útiles para tareas relacionadas con las finanzas. Utiliza un formato de aviso específico para cada modelo. Acepta caracteres especiales, que pueden utilizarse para generar resultados estructurados.
Size
13 mil millones de parámetros
Nivel de precios API
Clase 1. Para obtener detalles sobre los precios, consulte la Tabla 2 y la Tabla 4.
Disponibilidad
Proporcionado por IBM implementado en hardware multiusuario.
Longitud de la ventana de contexto (entrada + salida): 8192
Nota: El número máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 4096.
Idiomas naturales admitidos
Inglés
Información de ajuste de instrucciones
La familia de modelos de aprendizaje automático ( Granite ) se entrena con conjuntos de datos relevantes para la empresa de cinco ámbitos: Internet, académico, código, legal y financiero. Los datos utilizados para entrenar los modelos se someten primero a revisiones de gobernanza de datos e IBM es y se les filtra el texto que está marcado por odio, abuso o blasfemia por el filtro HAP desarrollado por la Fundación contra la Difamación ( IBM ). IBM comparte información sobre los métodos de formación y los conjuntos de datos utilizados.
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
Un modelo básico de la familia de joyas de Tiffany & Co. ( IBM ) Granite. El modelo de la fundación granite-20b-multilingual se basa en el modelo básico de 20 000 millones de dólares de la Fundación Granite, y está entrenado para comprender y generar texto en inglés, alemán, español, francés y portugués.
Uso
Inglés, alemán, español, francés y portugués. Respuesta a preguntas de dominio cerrado, resumen, generación, extracción y clasificación.
Nota:Este modelo de fundación apoya las habilidades que aporta la comunidad de código abierto de InstructLab.
Size
20 000 millones de parámetros
Nivel de precios API
Clase 1. Para obtener detalles sobre los precios, consulte la Tabla 2.
Disponibilidad
Proporcionado por IBM implementado en hardware multiusuario.
Implementación bajo demanda para uso exclusivo, excepto en el centro de datos de Fráncfort.
Longitud de la ventana de contexto (entrada + salida): 8192
Idiomas naturales admitidos
Inglés, alemán, español, francés y portugués
Información de ajuste de instrucciones
La familia de modelos de aprendizaje automático ( Granite ) se entrena con conjuntos de datos relevantes para la empresa de cinco ámbitos: Internet, académico, código, legal y financiero. Los datos utilizados para entrenar los modelos se someten primero a revisiones de gobernanza de datos e IBM es y se les filtra el texto que está marcado por odio, abuso o blasfemia por el filtro HAP desarrollado por la Fundación contra la Difamación ( IBM ). IBM comparte información sobre los métodos de formación y los conjuntos de datos utilizados.
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
Modelos de base de la familia de productos IBM Granite. Los modelos de la fundación Granite Code son modelos que siguen instrucciones y se ajustan mediante una combinación de commits de Git, junto con instrucciones humanas y conjuntos de datos de instrucciones de código generado sintéticamente de código abierto.
El modelo de base granite-8b-code-instruct v2.0.0 puede procesar mensajes más grandes con una mayor longitud de ventana de contexto.
Nota:Cuando extraiga este modelo de la Prompt Lab, desactive las barreras de seguridad de IA.
Uso
Los siguientes modelos de base de código abierto ( Granite Code ) están diseñados para responder a instrucciones relacionadas con la codificación y pueden utilizarse para crear asistentes de codificación:
granite-3b-code-instruct
granite-8b-code-instruct
granite-20b-code-instruct
granite-34b-code-instruct
Los siguientes modelos de base de datos de Granite Code son versiones ajustadas a las instrucciones del modelo de base de datos de granite-20b-code-base que están diseñadas para tareas de generación de texto a SQL.
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Tamaños
3000 millones de parámetros
8 mil millones de parámetros
20 000 millones de parámetros
34 mil millones de parámetros
Nivel de precios API
Clase 1.
Para obtener detalles sobre los precios de los modelos de código proporcionados, consulte la Tabla 2.
Para obtener detalles sobre los precios de los modelos de implementación bajo demanda, consulte la Tabla 4.
Disponibilidad
Todos los modelos de código, excepto los modelos de texto a SQL: proporcionados por IBM implementados en hardware multitenant.
Todos los modelos de código, incluidos los modelos de base de texto a SQL: Implementación bajo demanda para uso dedicado.
Longitud de la ventana de contexto (entrada + salida)
granite-3b-code-instruct : 128 000
Cuando el modelo se ejecuta solo en el entorno multitenant, se aplica un límite máximo de nuevos tokens, lo que significa que los tokens generados por el modelo base por solicitud están limitados a 8192.
granite-8b-code-instruct : 128 000
Cuando el modelo se ejecuta solo en el entorno multitenant, se aplica un límite máximo de nuevos tokens, lo que significa que los tokens generados por el modelo base por solicitud están limitados a 8192.
granite-20b-code-instruct : 8192
El máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 4096.
granite-20b-code-base-schema-linking : 8192
granite-20b-code-base-sql-gen : 8192
granite-34b-code-instruct : 8192
Idiomas naturales admitidos
Inglés
Lenguajes de programación soportados
Python Los modelos de la fundación Granite Code son compatibles con 116 lenguajes de programación, entre los que se incluyen JavaScript, Java, C++, Go y Rust. Para ver la lista completa, consulte los modelos de base de IBM.
Información de ajuste de instrucciones
Estos modelos se perfeccionaron a partir de modelos básicos de Granite Code , basándose en una combinación de datos de instrucciones con licencia permisiva para mejorar las capacidades de seguimiento de instrucciones, incluidas las habilidades de razonamiento lógico y resolución de problemas.
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
Los modelos de base de la colección Granite Guardian pertenecen a la familia de modelos IBM Granite. Los modelos de la fundación granite-guardian-3-2b y granite-guardian-3-8b son modelos de ajuste fino ( Granite Instruct ) diseñados para detectar riesgos en las indicaciones y respuestas. Los modelos de base ayudan a detectar riesgos en muchas dimensiones clave del Atlas de Riesgos de IA.
La versión de generación e 3.1 e de los modelos se entrena con una combinación de datos sintéticos adicionales y anotados por humanos para mejorar el rendimiento en cuanto a riesgos relacionados con alucinaciones y fugas.
Uso
Granite Guardian los modelos de base están diseñados para detectar riesgos relacionados con daños en el texto de respuesta o en la respuesta del modelo (como barandillas de seguridad) y pueden utilizarse en casos de uso de generación aumentada por recuperación para evaluar la relevancia del contexto (si el contexto recuperado es relevante para la consulta), la fundamentación (si la respuesta es precisa y fiel al contexto proporcionado) y la relevancia de la respuesta (si la respuesta aborda directamente la consulta del usuario).
Tamaños
2000 millones de parámetros
8 mil millones de parámetros
Nivel de precios API
2b: Clase C1
8b: Clase 12
Para obtener detalles sobre los precios, consulte la Tabla 2.
Disponibilidad
Proporcionado por IBM implementado en hardware multiusuario.
Longitud de la ventana de contexto (entrada + salida)
2b: 131 072
8b: 131 072
Nota: El máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 8192.
Idiomas naturales admitidos
Inglés
Información de ajuste de instrucciones
Los modelos de aprendizaje profundo ( Granite Guardian ) son modelos de aprendizaje automático ( Granite Instruct ) perfeccionados mediante una combinación de datos humanos anotados y sintéticos.
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
Granite time series los modelos Foundation pertenecen a la familia de modelos IBM Granite. Estos modelos son modelos compactos y preentrenados para la previsión de series temporales multivariantes de la investigación de la Universidad de Carolina del Norte ( IBM ). Las siguientes versiones están disponibles para su uso en la previsión de datos en watsonx.ai:
granite-ttm-512-96-r2
granite-ttm-1024-96-r2
granite-ttm-1536-96-r2
Uso
Puede aplicar uno de estos modelos preentrenados a sus datos de destino para obtener una previsión inicial sin tener que entrenar el modelo con sus datos. Cuando se les proporciona un conjunto de observaciones de datos históricos y cronometrados, los modelos de la fundación Granite time series , pueden aplicar su comprensión de los sistemas dinámicos para pronosticar valores de datos futuros. Estos modelos funcionan mejor con puntos de datos en intervalos de minutos u horas y generan un conjunto de datos de previsión con hasta 96 puntos de datos por canal objetivo.
Puntos de datos mínimos requeridos por canal en la solicitud de API:
granite-ttm-512-96-r2: 512
granite-ttm-1024-96-r2: 1024
granite-ttm-1536-96-r2: 1536
Idiomas naturales admitidos
Inglés
Información de ajuste de instrucciones
Los modelos de aprendizaje profundo ( Granite time series ) se entrenaron con casi mil millones de muestras de datos de series temporales de diversos ámbitos, como electricidad, tráfico, fabricación y otros.
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
Granite Visión 3.2 2b es un modelo de base de imagen a texto creado para casos de uso empresarial. Este modelo de e Granite a multimodal es capaz de asimilar imágenes y texto para tareas como la comprensión de tablas, diagramas, gráficos y mucho más.
Uso
El modelo de base de datos granite-vision-3-2-2b está diseñado para la comprensión visual de documentos, lo que permite la extracción automatizada de contenido de tablas, gráficos, infografías, diagramas y más.
Nota : Se recomienda utilizar el modelo de procesamiento visual ( granite-vision-3-2-2b ) solo con archivos de imagen para el procesamiento visual y la comprensión de casos de uso.
Size
2000 millones de parámetros
Nivel de precios API
Clase C1
Disponibilidad
Proporcionado por IBM implementado en hardware multiusuario.
Límites de fichas
Longitud de la ventana de contexto (entrada + salida): 131 072
Nota: El número máximo de nuevos tokens, es decir, los tokens generados por el modelo de fundación por solicitud, está limitado a 16 384.
El modelo de la fundación granite-vision-3-2-2b se entrenó con un conjunto de datos seleccionados que seguían instrucciones, compuesto por diversos conjuntos de datos públicos y conjuntos de datos sintéticos adaptados para apoyar una amplia gama de tareas de comprensión de documentos e imágenes en general. Se entrenó ajustando el modelo de base de la red neuronal artificial ( granite-3-2b-instruct ) con modalidades de imagen y texto.
Arquitectura del modelo
decodificador
Licencia
Consulte las descripciones de los dos servicios que componen watsonx.ai:
IBM -los modelos de base desarrollados se consideran parte del Servicio de IBM Cloud. Cuando utilice un modelo de base desarrollado por IBM que se proporciona en watsonx.ai, se aplicarán las protecciones contractuales relacionadas con la indemnización de IBM. Para obtener más información, consulte el Acuerdo de relación con el cliente de IBM, además de las descripciones de los servicios.
Los modelos de cimientos obsoletos se resaltan con un icono de advertencia de obsoleto . Para obtener más información sobre la retirada de productos, incluidos los detalles de la retirada de modelos de la fundación, consulte Ciclo de vida de los modelos de la fundación.
Recursos relacionados con el modelo Granite
Copy link to section
Para obtener más información sobre los modelos base de IBM Granite , lea los recursos siguientes: