0 / 0
Volver a la versión inglesa de la documentación
Detalles de facturación de los activos de IA generativa
Última actualización: 05 dic 2024
Detalles de facturación de los activos de IA generativa

Obtenga información sobre cómo se mide el uso de los activos de IA generativa mediante unidades de recursos (RU), tarifas horarias o una tarifa plana.

Trabajar con activos de IA generativa con ' watsonx.ai Runtime requiere que esté utilizando ' watsonx.ai. Para más información sobre watsonx.ai, véase Visión general de IBM watsonx.ai.

Revise los detalles de cómo se miden los recursos utilizando:

  • Unidades de recursos para medir las actividades de inferencia de los modelos fundacionales proporcionados por watsonx.ai.
  • Tarifas por hora para los modelos de cimientos personalizados que importe y despliegue con watsonx.ai.
  • Tarifas por hora para modelos de cimentación curados desplegados bajo demanda en hardware dedicado.
  • Tarifas planas por página para la extracción de texto de documentos.

Medición de unidades de recursos para modelos de cimentación

Para consultar la lista de modelos de bases compatibles y sus precios, véase Modelos de cimientos compatibles. Para ver la lista de modelos de codificadores compatibles y sus precios, consulte Modelos de codificadores compatibles.

Una Unidad de Recurso (RU) equivale a 1000 tokens de la entrada y la salida de la inferencia foundation model. Un token es una unidad básica de texto (normalmente 4 caracteres o 0.75 palabras) que se utiliza en la entrada o la salida para la consulta de un foundation model o para la entrada de un modelo de incrustación.

A cada foundation model proporcionado por IBM watsonx.ai se le asigna un precio de inferencia para la entrada y la salida. El precio se obtiene como múltiplo del precio base de una UI (0.0001). Por ejemplo, un modelo con un precio de0.0006 tiene un multiplicador de 6 veces la tarifa base.

Importante: Existen límites por plan en el número de solicitudes de inferencia por segundo que se envían a un modelo. Si un usuario supera un límite de solicitud de inferencia, una notificación del sistema le orienta.

A un " foundation model " sintonizado se le asigna el mismo precio que al " foundation model" subyacente. Para obtener información sobre los modelos de cimentación sintonizados, consulte Tuning Studio. El ajuste de un modelo en Tuning Studio consume unidades de capacidad horaria (CUH). Para obtener más información, consulte Detalles de facturación de los activos de aprendizaje automático.

Cálculo de la tasa unitaria de recursos por modelo

Para calcular los gastos de inferencia foundation model, divida el número total de fichas consumidas durante el mes entre 1000 y redondee al alza para obtener el número total de EF. Multiplique el número total de UI por el precio del modelo para obtener los gastos totales de utilización. El precio del modelo varía según el modelo y también puede variar para los tokens de entrada o salida de un modelo determinado.

La fórmula básica es la siguiente:

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

El precio base de una UI es de0.0001. El precio de cada foundation model es un múltiplo del precio base.

Clases de facturación por multiplicador

Si está supervisando el uso de modelos con la API watsonx.ai, los precios de los modelos se muestran por niveles de precios, como se indica a continuación:

Tabla 1. Niveles de precios de la API
Modelo de nivel de precios Precio por RU en USD Multiplicador
tipo básico
Clase 1 $0.0006 6
Clase 2 $0.0018 18
Clase 3 $0.0050 50
Clase C1 $0.0001 1
Clase 5 $0.00025 2.5
Clase 7 $0.016 160
Clase 8 $0.00015 1.5
Clase 9 $0.00035 3.5
Clase 10 $0.0020 20
Clase 11 $0.000005 0.05
Clase 12 $0.0002 2
Nota:

Algunos modelos, como Mistral Large, tienen precios especiales que no se asignan mediante un multiplicador. Los precios se indican en modelos con soporte.

Tarifas por hora para modelos de cimentación personalizados

La implantación de modelos de cimientos personalizados requiere el plan Estándar.

Las tarifas de facturación dependen de la configuración del hardware del modelo y se aplican al alojamiento y la inferencia del modelo. Los cargos comienzan cuando el modelo se despliega con éxito y continúan hasta que se elimina el modelo.

Tabla 2. Tarifas de facturación foundation model personalizado
Tamaño de configuración Tarifa por hora en USD
Pequeña $5.22
Medio $10.40
Grande $20.85
Importante: Puede desplegar un máximo de cuatro modelos de base personalizados pequeños, dos medianos o uno grande por cuenta.

Para más detalles sobre la elección de una configuración para un " foundation model" personalizado, véase " Planificación del despliegue de un " foundation model" personalizado .

Tarifas de facturación por horas para modelos de despliegue bajo demanda

Implemente modelos de base bajo demanda cuando desee una solución alojada reservada para uso exclusivo de su organización. Sólo los colegas a los que conceda acceso al despliegue pueden inferir el foundation model. Un despliegue dedicado significa interacciones más rápidas y con mayor capacidad de respuesta, y permite avisos con ventanas contextuales de mayor longitud. Las tarifas se fijan por modelo y se aplican al alojamiento y la inferencia del modelo. Los cargos comienzan cuando se despliega el modelo y continúan hasta que se elimina.

Nota: El despliegue de modelos de cimientos bajo demanda requiere el plan Estándar. Actualmente, esta función sólo está disponible para el centro de datos de Dallas.

Para obtener más información sobre el despliegue de un foundation model bajo demanda, incluidos los precios, consulte Modelos básicos compatibles disponibles con watsonx.ai.

Tarifas por página para la extracción de texto de documentos

Utilice el método de extracción de texto de documentos de la API REST de watsonx.ai para convertir archivos PDF muy estructurados y que utilicen diagramas y tablas para transmitir información, en un formato de archivo JSON compatible con modelos de AI. Para más información, consulte Extracción de texto de documentos.

La facturación se realiza a tanto alzado por página procesada. Una página puede ser una página de texto (hasta 1800 caracteres), una imagen o un marco .tiff. La tarifa de facturación depende de su tipo de plan.

Tabla 3. Precios de extracción de textos
Tipo de plan Precio por página en USD
Esencial $0.038
Estándar $0.030

Más información

Tema principal: watsonx.ai Planes de ejecución

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información