Cuando entrena o puntúa un modelo o una función, elige el tipo, el tamaño y la potencia de la configuración de hardware que coincide con sus necesidades de cálculo.
Configuraciones de hardware predeterminadas
Elija la configuración de hardware para su activo watsonx.ai Runtime cuando entrene el activo o cuando lo despliegue.
Tipo de capacidad | Unidades de capacidad por hora |
---|---|
Extra pequeño: 1x4 = 1 vCPU y 4 GB de RAM | 0.5 |
Pequeño: 2x8 = 2 vCPU y 8 GB de RAM | 1 |
Mediano: 4x16 = 4 vCPU y 16 GB de RAM | 2 |
Grande: 8x32 = 8 vCPU y 32 GB de RAM | 4 |
Extra grande: 16x64 = 16 vCPU y 64 GB de RAM | 8 |
Uso computacional de los activos en tiempo de ejecución de watsonx.ai
Los despliegues y la puntuación consumen recursos informáticos en forma de unidades de capacidad horaria (CUH) del servicio watsonx.ai Runtime.
Para comprobar el consumo mensual total de CUH de sus servicios watsonx.ai Runtime, en el menú de navegación, seleccione Administración -> Entorno runtimes.
Además, puede supervisar el uso de recursos mensual en cada espacio de despliegue específico. Para ello, desde el espacio de despliegue, vaya al separador Gestionar y, a continuación, seleccione Uso de recursos. El resumen muestra las CUH utilizadas por tipo de despliegue: por separado para despliegues de AutoAI , despliegues de aprendizaje federado, despliegues por lotes y despliegues en línea.
Detalles de uso de cálculo
La tasa de CUH consumidas viene determinada por los requisitos de cálculo de los despliegues. Se basa en variables tales como:
- Tipo de despliegue
- tipo de infraestructura
- complejidad de la puntuación Escalar un despliegue para dar soporte a más usuarios y solicitudes simultáneas también aumenta el consumo de CUH. Como muchas variables afectan al consumo de recursos para un despliegue, se recomienda que ejecute pruebas en los modelos y despliegues para analizar el consumo de CUH.
La forma en que los despliegues en línea consumen unidades de capacidad se basa en la infraestructura. Para algunas infraestructuras, las CUH se cargan por el número de horas que el activo de despliegue está activo en un espacio de despliegue. Por ejemplo, los modelos de SPSS en modalidad de despliegue en línea que se ejecutan durante 24 horas al día, siete días a la semana, consumen CUH y se cargan durante ese periodo. Un despliegue en línea activo no tiene tiempo de inactividad. Para otras infraestructuras, las CUH se cargan de acuerdo con la duración de la puntuación. Consulte la tabla de consumo de CUH para obtener detalles sobre cómo se calcula el uso de CUH.
El tiempo de cálculo se calcula en milisegundos, con un mínimo de 1 minuto para cada operación distinta. Por ejemplo:
- Una ejecución de entrenamiento que tarda 12 segundos se factura como 1 minuto
- Una ejecución de entrenamiento que tarda 83.555 segundos se factura exactamente como se ha calculado
Consumo de CUH por el despliegue y el tipo de infraestructura
El consumo de CUH se calcula utilizando estas fórmulas:
Tipo de despliegue | Infraestructura | Cálculo de CUH |
---|---|---|
En línea | AutoAI, función AI, SPSS, bibliotecas personalizadas Scikit-Learn, Tensorflow, RShiny | Duración activa de despliegue * Número de nodos * Velocidad de CUH para infraestructura de tipo de capacidad |
En línea | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | Duración de puntuación en segundos * Número de nodos * Velocidad de CUH para infraestructura de tipo de capacidad |
Despliegue | todas las infraestructuras | Duración del trabajo en segundos * Número de nodos * Velocidad de CUH para infraestructura de tipo de capacidad |
Más información
- Despliegue de activos
- watsonx.ai Servicio en tiempo de ejecución
- Supervisión del uso de recursos de la cuenta
Tema padre: Gestión de despliegues predictivos