0 / 0
Volver a la versión inglesa de la documentación
Detalles de facturación de los activos de aprendizaje automático
Última actualización: 12 dic 2024
Detalles de facturación de los activos de aprendizaje automático

Conozca cómo se mide el uso de los activos de aprendizaje automático utilizando las horas de unidad de capacidad (CUH).

watsonx.ai Uso y precios de la informática en tiempo de ejecución

watsonx.ai El uso de computación en tiempo de ejecución se calcula mediante el número de unidades de capacidad horaria (CUH) consumidas por una instancia de aprendizaje automático activa. La tasa de unidades de capacidad por hora consumida viene determinada por los requisitos de cálculo de los activos y modelos de Machine Learning. Por ejemplo, un modelo con un conjunto de datos grande y complejo consumirá más recursos de entrenamiento que un modelo con un conjunto de datos más pequeño y sencillo. Tenga en cuenta que ampliar un despliegue para dar soporte a más usuarios y solicitudes simultáneos también aumenta el consumo de CUH.

Consejo: Debido a que hay tantas variables que afectan al consumo de recursos de una implantación, la práctica recomendada es realizar pruebas en sus modelos e implantaciones para analizar el consumo de CUH.

Para todos los planes:

  • El consumo de la tasa de capacidad por unidad-hora (CUH) para la formación se basa en la herramienta de formación, la especificación del hardware y el entorno de ejecución.
  • El consumo de unidades de capacidad-hora (CUH) para el despliegue se basa en el tipo de despliegue, la especificación del hardware y la especificación del software.
  • watsonx.ai Runtime impone límites al número de trabajos de despliegue retenidos para cada espacio de despliegue individual. Si supera su límite, no podrá crear nuevos trabajos de despliegue hasta que elimine los existentes o actualice su plan. De forma predeterminada, los metadatos de trabajo se suprimirán automáticamente al cabo de 30 días. Puede alterar temporalmente este valor al crear un trabajo. Consulte Gestión de trabajos.
  • El tiempo de inactividad se refiere a la cantidad de tiempo para considerar un despliegue activo entre las solicitudes de puntuación. Si un despliegue no recibe solicitudes de puntuación durante una duración determinada, se trata como inactivo o desocupado y la facturación se detiene para todas las infraestructuras distintas de SPSS.
  • Un plan permite como mínimo el límite de tarifa declarado, y el límite de tarifa real puede ser superior al límite declarado. Por ejemplo, el plan Lite podría procesar más de 2 solicitudes por segundo sin emitir un error. Si tiene un plan de pago y cree que está alcanzando el límite de tarifa por error, póngase en contacto con el soporte de IBM para obtener ayuda.
  • El tiempo de cálculo se calcula al milisegundo. Sin embargo, hay un mínimo de un minuto para cada operación distinta. Es decir, una ejecución de entrenamiento que tarda 12 segundos se factura como un minuto para la cuota de hora de unidad de capacidad, mientras que una ejecución de entrenamiento que tarda 83,555 segundos se factura exactamente como se ha calculado.
  • La forma en que los despliegues en línea consumen unidades de capacidad se basa en la infraestructura. En algunas infraestructuras, CUH se carga por el número de horas que el activo de despliegue está activo en un espacio de despliegue. Por ejemplo, los modelos de SPSS en modalidad de despliegue en línea que se ejecutan 24 horas al día durante siete días a la semana consumen CUH y se le cobrará por ese periodo. No hay tiempo de inactividad para un despliegue en línea activo. Para otras infraestructuras, CUH se carga de acuerdo con la duración de la puntuación. Consulte la tabla de consumo de CUH para obtener detalles sobre cómo se calcula CUH.

Índices de consumo de CUH por tipo de activo

Tabla 3. Índices de consumo de CUH por tipo de activo
Tipo de activo Tipo de capacidad Unidades de capacidad por hora
Experimento de AutoAI 8 vCPU y 32 GB de RAM 20
Formación en Decision Optimization 2 vCPU y 8 GB
vCPU y 16 GB
vCPU y 32 GB
vCPU y 64 GB RAM
6
7
9
13
Implementación de Decision Optimization 2 vCPU y 8 GB
vCPU y 16 GB
vCPU y 32 GB
vCPU y 64 GB RAM
30
40
50
60

Machine Learning (formación, evaluación o puntuación)
1 vCPU y 4 GB de
vCPU y 8 GB de
vCPU y 16 GB de
vCPU y 32 GB de
vCPU y 64 GB de RAM
0.5
1
2
4
8
'Tuning Studio '
(watsonx solamente)
NVIDIA A100 80GB GPU 43

Consumo de CUH por el despliegue y el tipo de infraestructura

El consumo de CUH se calcula utilizando estas fórmulas:

Tipo de despliegue Infraestructura Cálculo de CUH
En línea AutoAI, AI function, servicio AI, SPSS, bibliotecas personalizadas Scikit-Learn, Tensorflow, RShiny duración_activa_del_despliegue_en_horas * nº_de_nodos * tasa_CUH_para_tipo_de_capacidad_de_marco
En línea Spark, PMML, Scikit-Learn, Pytorch, XGBoost score_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_framework
Despliegue todas las infraestructuras duración_del_trabajo_en_horas * nº_de_nodos * tasa_CUH_para_tipo_de_capacidad_marco

Por ejemplo, considere un trabajo de despliegue por lotes de Decision Optimization que se ejecuta durante 15 minutos. El consumo de recursos se calcula así: 15 minutos = 0.25 horas, en 2 nodos, y con 2 vCPU y 8 GB de RAM. Esta combinación da como resultado una tasa de CUH de 30, por lo que cada vez que se ejecuta el trabajo consume 0.25 * 2 * 30, lo que equivale a 15 CUH.

Estas tablas muestran el cálculo de unidades de capacidad por hora para entornos de aprendizaje automático predefinidos, por tipo de uso.

Unidades de capacidad por hora para modelos de entrenamiento, evaluación o puntuación

Tipo de capacidad Unidades de capacidad por hora
Extra pequeño: 1 vCPU y 4 GB RAM 0.5
Pequeño: 2 vCPU y 8 GB RAM 1
Media: 4 vCPU y 16 GB RAM 2
Grande: 8 vCPU y 32 GB RAM 4
Extra grande: 16 vCPU y 64 GB RAM 8

 

Unidades de capacidad por hora para experimentos de IA automática

Tipo de capacidad Unidades de capacidad por hora
8 vCPU y 32 GB de RAM 20

 

Unidades de capacidad por hora para experimentos de Decision Optimization

Estos planes se aplican a los experimentos Decision Optimization ejecutados en watsonx.ai Studio.

Tipo de capacidad Unidades de capacidad por hora
Decision Optimization: 2 vCPU y 8 GB de RAM 6
Decision Optimization: 4 vCPU y 16 GB de RAM 7
Decision Optimization: 8 vCPU y 32 GB RAM 9
Decision Optimization: 16 vCPU y 64 GB de RAM 13

 

Unidades de capacidad por hora para la Decision Optimization en watsonx.ai Runtime

Estos planes se aplican a Decision Optimization desplegada y ejecutada desde watsonx.ai Runtime.

Tipo de capacidad Unidades de capacidad por hora
Decision Optimization: 2 vCPU y 8 GB de RAM 30
Decision Optimization: 4 vCPU y 16 GB de RAM 40
Decision Optimization: 8 vCPU y 32 GB RAM 50
Decision Optimization: 16 vCPU y 64 GB de RAM 60

Supervisión del uso de recursos

Puede realizar un seguimiento del uso de los recursos de los activos que posee o en los que colabora en un proyecto o espacio. Si es propietario o administrador de una cuenta, puede realizar el seguimiento de las CUH de toda una cuenta. Para obtener más información, consulte Supervisión del uso de los recursos de la cuenta.

Puede realizar un seguimiento del uso del tiempo de ejecución de una cuenta en la página Tiempos de ejecución del entorno si es el propietario o administrador de la cuenta de IBM Cloud o el propietario del servicio watsonx.ai Runtime. Para más información, consulte Supervisión de recursos.

Seguimiento del consumo de CUH para el aprendizaje automático en un cuaderno

Para calcular las horas de unidad de capacidad en un cuaderno, utilice:

CP =  client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)

Por ejemplo:

'capacity_units': {'current': 19773430}

19773430/(3600*1000)

returns 5.49 CUH

Para obtener más información, consulte la sección Instancias de servicio de la documentación de la API de tiempo de ejecución deIBM watsonx.ai.

Más información

Tema principal: watsonx.ai Planes de ejecución

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información