Obtenga información sobre cómo se mide el uso de los activos de IA generativa mediante unidades de recursos (RU), tarifas horarias o una tarifa plana.
Trabajar con activos de IA generativa con ' watsonx.ai Runtime requiere que esté utilizando ' watsonx.ai. Para más información sobre watsonx.ai, véase Visión general de IBM watsonx.ai.
Revise los detalles de cómo se miden los recursos utilizando:
- Unidades de recursos para medir las actividades de inferencia de los modelos fundacionales proporcionados por watsonx.ai.
- Tarifas por hora para los modelos de cimientos personalizados que importe y despliegue con watsonx.ai.
- Tarifas por hora para modelos de cimentación curados desplegados bajo demanda en hardware dedicado.
- Tarifas planas por página para la extracción de texto de documentos.
Medición de unidades de recursos para modelos de cimentación
Para consultar la lista de modelos de bases compatibles y sus precios, véase Modelos de cimientos compatibles. Para ver la lista de modelos de codificadores compatibles y sus precios, consulte Modelos de codificadores compatibles.
Una Unidad de Recurso (RU) equivale a 1000 tokens de la entrada y la salida de la inferencia foundation model. Un token es una unidad básica de texto (normalmente 4 caracteres o 0.75 palabras) que se utiliza en la entrada o la salida para la consulta de un foundation model o para la entrada de un modelo de incrustación.
A cada foundation model proporcionado por IBM watsonx.ai se le asigna un precio de inferencia para la entrada y la salida. El precio se obtiene como múltiplo del precio base de una UI (0.0001). Por ejemplo, un modelo con un precio de0.0006 tiene un multiplicador de 6 veces la tarifa base.
A un " foundation model " sintonizado se le asigna el mismo precio que al " foundation model" subyacente. Para obtener información sobre los modelos de cimentación sintonizados, consulte Tuning Studio. El ajuste de un modelo en Tuning Studio consume unidades de capacidad horaria (CUH). Para obtener más información, consulte Detalles de facturación de los activos de aprendizaje automático.
Cálculo de la tasa unitaria de recursos por modelo
Para calcular los gastos de inferencia foundation model, divida el número total de fichas consumidas durante el mes entre 1000 y redondee al alza para obtener el número total de EF. Multiplique el número total de UI por el precio del modelo para obtener los gastos totales de utilización. El precio del modelo varía según el modelo y también puede variar para los tokens de entrada o salida de un modelo determinado.
La fórmula básica es la siguiente:
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
El precio base de una UI es de0.0001. El precio de cada foundation model es un múltiplo del precio base.
Clases de facturación por multiplicador
Si está supervisando el uso de modelos con la API watsonx.ai, los precios de los modelos se muestran por niveles de precios, como se indica a continuación:
Modelo de nivel de precios | Precio por RU en USD | Multiplicador tipo básico |
---|---|---|
Clase 1 | $0.0006 | 6 |
Clase 2 | $0.0018 | 18 |
Clase 3 | $0.0050 | 50 |
Clase C1 | $0.0001 | 1 |
Clase 5 | $0.00025 | 2.5 |
Clase 7 | $0.016 | 160 |
Clase 8 | $0.00015 | 1.5 |
Clase 9 | $0.00035 | 3.5 |
Clase 10 | $0.0020 | 20 |
Clase 11 | $0.000005 | 0.05 |
Clase 12 | $0.0002 | 2 |
Algunos modelos, como Mistral Large, tienen precios especiales que no se asignan mediante un multiplicador. Los precios se indican en modelos con soporte.
Tarifas por hora para modelos de cimentación personalizados
La implantación de modelos de cimientos personalizados requiere el plan Estándar.
Las tarifas de facturación dependen de la configuración del hardware del modelo y se aplican al alojamiento y la inferencia del modelo. Los cargos comienzan cuando el modelo se despliega con éxito y continúan hasta que se elimina el modelo.
Tamaño de configuración | Tarifa por hora en USD |
---|---|
Pequeña | $5.22 |
Medio | $10.40 |
Grande | $20.85 |
Para más detalles sobre la elección de una configuración para un " foundation model" personalizado, véase " Planificación del despliegue de un " foundation model" personalizado .
Tarifas de facturación por horas para modelos de despliegue bajo demanda
Implemente modelos de base bajo demanda cuando desee una solución alojada reservada para uso exclusivo de su organización. Sólo los colegas a los que conceda acceso al despliegue pueden inferir el foundation model. Un despliegue dedicado significa interacciones más rápidas y con mayor capacidad de respuesta, y permite avisos con ventanas contextuales de mayor longitud. Las tarifas se fijan por modelo y se aplican al alojamiento y la inferencia del modelo. Los cargos comienzan cuando se despliega el modelo y continúan hasta que se elimina.
Para obtener más información sobre el despliegue de un foundation model bajo demanda, incluidos los precios, consulte Modelos básicos compatibles disponibles con watsonx.ai.
Tarifas por página para la extracción de texto de documentos
Utilice el método de extracción de texto de documentos de la API REST de watsonx.ai para convertir archivos PDF muy estructurados y que utilicen diagramas y tablas para transmitir información, en un formato de archivo JSON compatible con modelos de AI. Para más información, consulte Extracción de texto de documentos.
La facturación se realiza a tanto alzado por página procesada. Una página puede ser una página de texto (hasta 1800 caracteres), una imagen o un marco .tiff. La tarifa de facturación depende de su tipo de plan.
Tipo de plan | Precio por página en USD |
---|---|
Esencial | $0.038 |
Estándar | $0.030 |
Más información
- Para más detalles sobre los precios de los activos de aprendizaje automático, véase " Tarifas de facturación de activos de aprendizaje automático.
- Para obtener más información sobre el seguimiento de la asignación y el consumo de recursos informáticos, consulte Utilización en tiempo de ejecución.
- Para obtener más información sobre cada modelo, consulte Modelos de cimentación compatibles.
- Para obtener información sobre la compatibilidad regional de cada modelo, consulte Disponibilidad regional de los modelos de la Fundación.
Tema principal: watsonx.ai Planes de ejecución