Conozca cómo se mide el uso de los activos de aprendizaje automático utilizando las horas de unidad de capacidad (CUH).
watsonx.ai Uso y precios de la informática en tiempo de ejecución
watsonx.ai El uso de computación en tiempo de ejecución se calcula mediante el número de unidades de capacidad horaria (CUH) consumidas por una instancia de aprendizaje automático activa. La tasa de unidades de capacidad por hora consumida viene determinada por los requisitos de cálculo de los activos y modelos de Machine Learning. Por ejemplo, un modelo con un conjunto de datos grande y complejo consumirá más recursos de entrenamiento que un modelo con un conjunto de datos más pequeño y sencillo. Tenga en cuenta que ampliar un despliegue para dar soporte a más usuarios y solicitudes simultáneos también aumenta el consumo de CUH.
Para todos los planes:
- El consumo de la tasa de capacidad por unidad-hora (CUH) para la formación se basa en la herramienta de formación, la especificación del hardware y el entorno de ejecución.
- El consumo de unidades de capacidad-hora (CUH) para el despliegue se basa en el tipo de despliegue, la especificación del hardware y la especificación del software.
- watsonx.ai Runtime impone límites al número de trabajos de despliegue retenidos para cada espacio de despliegue individual. Si supera su límite, no podrá crear nuevos trabajos de despliegue hasta que elimine los existentes o actualice su plan. De forma predeterminada, los metadatos de trabajo se suprimirán automáticamente al cabo de 30 días. Puede alterar temporalmente este valor al crear un trabajo. Consulte Gestión de trabajos.
- El tiempo de inactividad se refiere a la cantidad de tiempo para considerar un despliegue activo entre las solicitudes de puntuación. Si un despliegue no recibe solicitudes de puntuación durante una duración determinada, se trata como inactivo o desocupado y la facturación se detiene para todas las infraestructuras distintas de SPSS.
- Un plan permite como mínimo el límite de tarifa declarado, y el límite de tarifa real puede ser superior al límite declarado. Por ejemplo, el plan Lite podría procesar más de 2 solicitudes por segundo sin emitir un error. Si tiene un plan de pago y cree que está alcanzando el límite de tarifa por error, póngase en contacto con el soporte de IBM para obtener ayuda.
- El tiempo de cálculo se calcula al milisegundo. Sin embargo, hay un mínimo de un minuto para cada operación distinta. Es decir, una ejecución de entrenamiento que tarda 12 segundos se factura como un minuto para la cuota de hora de unidad de capacidad, mientras que una ejecución de entrenamiento que tarda 83,555 segundos se factura exactamente como se ha calculado.
- La forma en que los despliegues en línea consumen unidades de capacidad se basa en la infraestructura. En algunas infraestructuras, CUH se carga por el número de horas que el activo de despliegue está activo en un espacio de despliegue. Por ejemplo, los modelos de SPSS en modalidad de despliegue en línea que se ejecutan 24 horas al día durante siete días a la semana consumen CUH y se le cobrará por ese periodo. No hay tiempo de inactividad para un despliegue en línea activo. Para otras infraestructuras, CUH se carga de acuerdo con la duración de la puntuación. Consulte la tabla de consumo de CUH para obtener detalles sobre cómo se calcula CUH.
Índices de consumo de CUH por tipo de activo
Tipo de activo | Tipo de capacidad | Unidades de capacidad por hora |
---|---|---|
Experimento AutoAI | 8 vCPU y 32 GB de RAM | 20 |
Formación en Decision Optimization | 2 vCPU y 8 GB vCPU y 16 GB vCPU y 32 GB vCPU y 64 GB RAM |
6 7 9 13 |
Implementación de Decision Optimization | 2 vCPU y 8 GB vCPU y 16 GB vCPU y 32 GB vCPU y 64 GB RAM |
30 40 50 60 |
Machine Learning (formación, evaluación o puntuación) |
1 vCPU y 4 GB de vCPU y 8 GB de vCPU y 16 GB de vCPU y 32 GB de vCPU y 64 GB de RAM |
0.5 1 2 4 8 |
'Tuning Studio ' (watsonx solamente) |
NVIDIA A100 80GB GPU | 43 |
Consumo de CUH por el despliegue y el tipo de infraestructura
El consumo de CUH se calcula utilizando estas fórmulas:
Tipo de despliegue | Infraestructura | Cálculo de CUH |
---|---|---|
En línea | AutoAI, AI function, servicio AI, SPSS, bibliotecas personalizadas Scikit-Learn, Tensorflow, RShiny | duración_activa_del_despliegue_en_horas * nº_de_nodos * tasa_CUH_para_tipo_de_capacidad_de_marco |
En línea | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | score_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_framework |
Por lotes | todas las infraestructuras | duración_del_trabajo_en_horas * nº_de_nodos * tasa_CUH_para_tipo_de_capacidad_marco |
Por ejemplo, considere un trabajo de despliegue por lotes de Decision Optimization que se ejecuta durante 15 minutos. El consumo de recursos se calcula así: 15 minutos = 0.25 horas, en 2 nodos, y con 2 vCPU y 8 GB de RAM. Esta combinación da como resultado una tasa de CUH de 30, por lo que cada vez que se ejecuta el trabajo consume 0.25 * 2 * 30, lo que equivale a 15 CUH.
Estas tablas muestran el cálculo de unidades de capacidad por hora para entornos de aprendizaje automático predefinidos, por tipo de uso.
Unidades de capacidad por hora para modelos de entrenamiento, evaluación o puntuación
Tipo de capacidad | Unidades de capacidad por hora |
---|---|
Extra pequeño: 1 vCPU y 4 GB RAM | 0.5 |
Pequeño: 2 vCPU y 8 GB RAM | 1 |
Media: 4 vCPU y 16 GB RAM | 2 |
Grande: 8 vCPU y 32 GB RAM | 4 |
Extra grande: 16 vCPU y 64 GB RAM | 8 |
Unidades de capacidad por hora para experimentos de IA automática
Tipo de capacidad | Unidades de capacidad por hora |
---|---|
8 vCPU y 32 GB de RAM | 20 |
Unidades de capacidad por hora para experimentos de Decision Optimization
Estos planes se aplican a los experimentos Decision Optimization ejecutados en watsonx.ai Studio.
Tipo de capacidad | Unidades de capacidad por hora |
---|---|
Decision Optimization: 2 vCPU y 8 GB de RAM | 6 |
Decision Optimization: 4 vCPU y 16 GB de RAM | 7 |
Decision Optimization: 8 vCPU y 32 GB RAM | 9 |
Decision Optimization: 16 vCPU y 64 GB de RAM | 13 |
Unidades de capacidad por hora para la Decision Optimization en watsonx.ai Runtime
Estos planes se aplican a Decision Optimization desplegada y ejecutada desde watsonx.ai Runtime.
Tipo de capacidad | Unidades de capacidad por hora |
---|---|
Decision Optimization: 2 vCPU y 8 GB de RAM | 30 |
Decision Optimization: 4 vCPU y 16 GB de RAM | 40 |
Decision Optimization: 8 vCPU y 32 GB RAM | 50 |
Decision Optimization: 16 vCPU y 64 GB de RAM | 60 |
Supervisión del uso de recursos
Puede realizar un seguimiento del uso de los recursos de los activos que posee o en los que colabora en un proyecto o espacio. Si es propietario o administrador de una cuenta, puede realizar el seguimiento de las CUH de toda una cuenta. Para obtener más información, consulte Supervisión del uso de los recursos de la cuenta.
Puede realizar un seguimiento del uso del tiempo de ejecución de una cuenta en la página Tiempos de ejecución del entorno si es el propietario o administrador de la cuenta de IBM Cloud o el propietario del servicio watsonx.ai Runtime. Para más información, consulte Supervisión de recursos.
Seguimiento del consumo de CUH para el aprendizaje automático en un cuaderno
Para calcular las horas de unidad de capacidad en un cuaderno, utilice:
CP = client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)
Por ejemplo:
'capacity_units': {'current': 19773430}
19773430/(3600*1000)
returns 5.49 CUH
Para obtener más información, consulte la sección Instancias de servicio de la documentación de la API de tiempo de ejecución deIBM watsonx.ai.
Más información
- Detalles de facturación de los activos de IA generativa
- Opciones de cálculo para experimentos de IA automática
- Opciones de cálculo para el entrenamiento y la puntuación de modelos
Tema principal: watsonx.ai Planes de ejecución