Detalles de facturación de los activos de IA generativa
Obtenga información sobre cómo se mide el uso de los activos de IA generativa mediante unidades de recursos (RU), tarifas horarias o una tarifa plana.
Trabajar con activos de IA generativa con ' watsonx.ai Runtime requiere que esté utilizando ' watsonx.ai. Para más información sobre watsonx.ai, véase Visión general de IBM watsonx.ai.
Revise los detalles de cómo se miden los recursos utilizando:
- Unidades de recursos para medir las actividades de inferencia para los modelos de base proporcionados por watsonx.ai.
- Tarifas por hora para los modelos de cimientos personalizados que importe y despliegue con watsonx.ai.
- Tarifas por hora para modelos de cimentación curados desplegados bajo demanda en hardware dedicado.
- Tarifas planas por página para la extracción de texto de documentos.
Una unidad de recursos se utiliza para medir los siguientes recursos:
- Fichas utilizadas para inferir un modelo de representación de lenguaje ( foundation model ) para generar texto o incrustaciones de texto.
- Puntos de datos utilizados por un e foundation model a de series temporales para pronosticar valores futuros.
Medición de unidades de recursos para inferir modelos de base
Para ver la lista de modelos base admitidos para generar texto y sus precios, consulte Modelos base admitidos. Para ver la lista de modelos de codificador compatibles para la reclasificación y la generación de incrustaciones de texto y sus precios, consulte Modelos de codificador compatibles.
Al medir la inferenci foundation model, una Unidad de Recurso (RU) equivale a 1000 tokens de la entrada y salida del foundation model. Un token es una unidad básica de texto (normalmente 4 caracteres o un 0.75 es palabras) que se utiliza en la entrada o salida de un indicador de " foundation model " o para la entrada en un modelo de incrustación.
A cada foundation model proporcionado por IBM watsonx.ai se le asigna un precio de inferencia para la entrada y la salida. El precio se obtiene como múltiplo del precio base de una UI (0.0001). Por ejemplo, un modelo con un precio de0.0006 tiene un multiplicador de 6 veces la tarifa base.
A un " foundation model " sintonizado se le asigna el mismo precio que al " foundation model" subyacente. Para obtener información sobre los modelos de cimentación sintonizados, consulte Tuning Studio. El ajuste de un modelo en Tuning Studio consume unidades de capacidad horaria (CUH). Para obtener más información, consulte Detalles de facturación de los activos de aprendizaje automático.
Medición de unidades de recursos para inferir modelos de series temporales fundamentales
A la hora de medir la previsión de la demanda ( foundation model ), una unidad de recursos (RU) equivale a 1000 puntos de datos en la entrada y salida de la demanda ( foundation model ). Un punto de datos es una unidad de contenido de entrada y salida que se expresa como uno o más números.
Clases de facturación por multiplicador
Si está supervisando el uso de modelos con la API watsonx.ai, los precios de los modelos se muestran por niveles de precios, como se indica a continuación:
Modelo de nivel de precios | Tipo de recurso | Precio por RU en USD | Multiplicador tipo básico |
---|---|---|---|
Clase 1 | Señales | $0.0006 | 6 |
Clase 2 | Señales | $0.0018 | 18 |
Clase 3 | Señales | $0.0050 | 50 |
Clase C1 | Señales | $0.0001 | 1 |
Clase 5 | Señales | $0.00025 | 2.5 |
Clase 7 | Señales | $0.016 | 160 |
Clase 8 | Señales | $0.00015 | 1.5 |
Clase 9 | Señales | $0.00035 | 3.5 |
Clase 10 | Señales | $0.0020 | 20 |
Clase 11 | Señales | $0.000005 | 0.05 |
Clase 12 | Señales | $0.0002 | 2 |
Clase 13 | Señales | $0.00071 | 7.1 |
Clase 14 | Puntos de datos | $0.00013 | 1.3 |
Clase 15 | Puntos de datos | $0.00038 | 3.8 |
Algunos modelos, como Mistral Large, tienen precios especiales que no se asignan mediante un multiplicador. Los precios se indican en modelos con soporte.
Cálculo de la tasa de unidad de recursos de fichas por modelo
Para calcular los gastos de inferencia foundation model, divida el número total de fichas consumidas durante el mes entre 1000 y redondee al alza para obtener el número total de EF. Multiplique el número total de UI por el precio del modelo para obtener los gastos totales de utilización. El precio del modelo varía según el modelo y también puede variar para los tokens de entrada o salida de un modelo determinado.
La fórmula básica es la siguiente:
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
El precio base de una UI es de0.0001. El precio de cada foundation model es un múltiplo del precio base.
Cálculo de la tasa de unidad de recursos de puntos de datos por modelo
Para calcular los cargos por pronóstico con una serie temporal foundation model, utilice las siguientes ecuaciones:
- Cálculo de entrada:
context length x number of series x number of channels
- Cálculo de la salida:
prediction length x number of series x number of channels
Estas ecuaciones utilizan los siguientes parámetros:
- La longitud del contexto se refiere al número de puntos de datos históricos que un e foundation model a de series temporales utiliza como entrada para hacer predicciones.
- Una serie es una colección de observaciones realizadas de forma secuencial a lo largo del tiempo. Por ejemplo, al comparar los precios de las acciones de muchas empresas, el historial de precios de las acciones observado para cada empresa es una serie independiente.
- Los canales son las características o variables específicas que se miden dentro de un conjunto de datos de series temporales.
- La longitud de predicción es el número de puntos de datos futuros que el modelo debe predecir.
Para obtener más información sobre estos valores, consulte Pronosticar valores de datos futuros.
Tipo de recurso | Modelo de nivel de precios | Precio en USD por unidad de medida |
---|---|---|
Introducir puntos de datos | Clase 14 | $0.00013 |
Puntos de datos de salida | Clase 15 | $0.00038 |
El siguiente ejemplo muestra cómo calcular el coste de una solicitud de previsión de series temporales con los siguientes parámetros:
Parámetro | Cantidad de ejemplo |
---|---|
Longitud del contexto (modelo granite-ttm-1536-96-r2 ) | 1.536 |
Canales | 10 |
Serie | 1.000 |
Duración de la predicción | 96 |
Total de puntos de datos de entrada: 15 360 000 (longitud de contexto de 1536, 10 canales, para 1000 series)
15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
Total de puntos de datos de salida: 960 000 (previsión de 96 puntos temporales, 10 canales, para 1000 series)
960,000 / 1,000 = 960 x 0.00038 = 0.3648
Precio total de la solicitud de previsión de series temporales: 2.36 $ (Coste de entrada: 1.9968 $ + Coste de salida: 0.3648 $)
1.9968 + 0.3648 = 2.3616
Tarifas por hora para modelos de cimentación personalizados
La implantación de modelos de cimientos personalizados requiere el plan Estándar.
Las tarifas de facturación dependen de la configuración del hardware del modelo y se aplican al alojamiento y la inferencia del modelo. Los cargos comienzan cuando el modelo se despliega con éxito y continúan hasta que se elimina el modelo.
Tamaño de configuración | Tarifa por hora en USD |
---|---|
Pequeña | $5.22 |
Medio | $10.40 |
Grande | $20.85 |
Para más detalles sobre la elección de una configuración para un " foundation model" personalizado, véase " Planificación del despliegue de un " foundation model" personalizado .
Tarifas de facturación por horas para modelos de despliegue bajo demanda
Implemente modelos de base bajo demanda cuando desee una solución alojada reservada para uso exclusivo de su organización. Sólo los colegas a los que conceda acceso al despliegue pueden inferir el foundation model. Un despliegue dedicado significa interacciones más rápidas y con mayor capacidad de respuesta, y permite avisos con ventanas contextuales de mayor longitud. Las tarifas se fijan por modelo y se aplican al alojamiento y la inferencia del modelo. Los cargos comienzan cuando se despliega el modelo y continúan hasta que se elimina.
Para obtener más información sobre la implementación de un foundation model bajo demanda, incluidos los precios, consulte Modelos de base compatibles en watsonx.ai.
Tarifas por página para la extracción de texto de documentos
Utilice el método de extracción de texto de documentos de la API REST de watsonx.ai para convertir archivos PDF muy estructurados y que utilicen diagramas y tablas para transmitir información, en un formato de archivo JSON compatible con modelos de AI. Para más información, consulte Extracción de texto de documentos.
La facturación se realiza a tanto alzado por página procesada. Una página puede ser una página de texto (hasta 1800 caracteres), una imagen o un marco .tiff. La tarifa de facturación depende de su tipo de plan.
Tipo de plan | Precio por página en USD |
---|---|
Básica | $0.038 |
Estándar | $0.030 |
Más información
- Para más detalles sobre los precios de los activos de aprendizaje automático, véase " Tarifas de facturación de activos de aprendizaje automático.
- Para obtener más información sobre el seguimiento de la asignación y el consumo de recursos informáticos, consulte Utilización en tiempo de ejecución.
- Para obtener más información sobre cada modelo, consulte Modelos de cimentación compatibles.
- Para obtener más información sobre la compatibilidad regional de cada modelo, consulte Disponibilidad regional de los modelos de la Fundación.
Tema principal: watsonx.ai Planes de ejecución