Découvrez comment l'utilisation des ressources d'apprentissage automatique est mesurée à l'aide d'unités d'heures de capacité (CUH).
watsonx.ai Utilisation et tarification de l'informatique en temps réel
watsonx.ai L'utilisation du calcul en temps réel est calculée par le nombre d'unités d'heures de capacité (CUH) consommées par une instance active d'apprentissage automatique. La quantité d'unités de capacité par heure consommées est déterminée par les exigences de calcul de vos actifs et modèles Machine Learning. Par exemple, un modèle présentant un jeu de données volumineux et complexe consommera davantage de ressources d'entraînement qu'un modèle présentant un jeu de données plus petit et plus simple. Notez que le dimensionnement d'un déploiement pour accepter davantage d'utilisateurs et de demandes simultanés augmente également la consommation de CUH.
Pour tous les plans :
- La consommation du taux de capacité-unité-heure (CUH) pour la formation est basée sur l'outil de formation, la spécification du matériel et l'environnement d'exécution.
- La consommation du taux de capacité-unité-heure (CUH) pour le déploiement est basée sur le type de déploiement, la spécification du matériel et la spécification du logiciel.
- watsonx.ai Runtime limite le nombre de travaux de déploiement retenus pour chaque espace de déploiement. Si vous dépassez votre limite, vous ne pourrez pas créer de nouvelles tâches de déploiement tant que vous n'aurez pas supprimé les tâches existantes ou mis à niveau votre plan. Par défaut, les métadonnées de travaux seront automatiquement supprimées au bout de 30 jours. Vous pouvez remplacer cette valeur lors de la création d'un travail. Voir Gestion des travaux.
- Le délai d'inactivité correspond au temps nécessaire pour considérer qu'un déploiement est actif entre les demandes de notation. Si un déploiement ne reçoit pas de demandes d'évaluation pendant une certaine durée, il est traité comme inactif, ou en veille, et la faccturation cesse pour toutes les infrastructures autres que SPSS.
- Un plan prévoit au moins la limite de taux déclarée, et la limite de taux réelle peut être plus élevée que la limite déclarée. Par exemple, le plan Lite peut traiter plus de 2 demandes par seconde sans émettre d'erreur. Si vous disposez d'un plan payant et que vous pensez atteindre la limite de débit par erreur, contactez le support IBM pour obtenir de l'aide.
- Le temps de calcul est calculé à la milliseconde près. Toutefois, il y a un minimum d'une minute pour chaque opération distincte. Ainsi, si une exécution d'entraînement dure 12 secondes, elle sera comptabilisée comme si elle avait duré une minute dans le calcul du nombre d'unités de capacité-heures, tandis qu'une exécution d'entraînement durant 83,555 secondes sera facturée sur la base de cette durée exacte.
- La manière dont les déploiements en ligne consomment les unités de capacité dépend de l'infrastructure. Pour certaines infrastructures, les CUH sont facturées pour le nombre d'heures d'activité de l'actif de déploiement dans un espace de déploiement. Par exemple, les modèles SPSS en mode de déploiement en ligne qui fonctionnent 24 heures par jour pendant sept jours par semaine consomment des unités de capacité-heures et sont facturés pour cette période. Il n'y pas de délai d'inactivité pour un déploiement en ligne actif. Pour les autres infrastructures, le CUH est facturé en fonction de la durée de l'évaluation. Pour le détail du calcul des CUH, voir le tableau de consommation de CUH.
Taux de consommation de CUH par type d'actif
Type d'actif | Type de capacité | Unités de capacité par heure |
---|---|---|
expérimentation AutoAI | 8 vCPU et 32 Go de mémoire RAM | 20 |
Formation à l'Decision Optimization | 2 vCPU et 8 GB vCPU et 16 GB vCPU et 32 GB vCPU et 64 GB RAM |
6 7 9 13 |
Déploiement de lDecision Optimization | 2 vCPU et 8 GB vCPU et 16 GB vCPU et 32 GB vCPU et 64 GB RAM |
30 40 50 60 |
d'Machine Learning (formation, évaluation ou notation) |
1 vCPU et 4 GB vCPU et 8 GB vCPU et 16 GB vCPU et 32 GB vCPU et 64 GB RAM |
0.5 1 2 4 8 |
Tuning Studio ' watsonx uniquement) |
NVIDIA A100 80GB GPU | 43 |
Consommation de CUH par type de déploiement et d'infrastructure
La consommation de CUH est calculée avec les formules suivantes :
Type de déploiement | Infrastructure | Calcul des CUH |
---|---|---|
En ligne | AutoAI, fonction IA, SPSS, bibliothèques personnalisées Scikit-Learn, Tensorflow, RShiny | durée_active_du_déploiement_en_heures * no_of_nodes * CUH_rate_for_capacity_type_framework |
En ligne | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | score_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_framework |
Lot | toutes les infrastructures | job_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_framework |
Prenons l'exemple d'une tâche de déploiement par lots de l Decision Optimization qui s'exécute pendant 15 minutes. La consommation de ressources est calculée de la manière suivante : 15 minutes = 0.25 heure, sur 2 nœuds, avec 2 vCPU et 8 Go de RAM. Cette combinaison se traduit par un taux de CUH de 30, de sorte que chaque fois que le travail est exécuté, il consomme 0.25 * 2 * 30, ce qui équivaut à 15 CUH.
Ces tableaux présentent le calcul des unités de capacité par heure pour des environnements d'apprentissage automatique prédéfinis, par type d'utilisation.
Unités de capacité par heure pour l'entraînement, l'évaluation ou le scoring des modèles
Type de capacité | Unités de capacité par heure |
---|---|
Extra petit : 1 vCPU et 4 GB RAM | 0.5 |
Petit : 2 vCPU et 8 GB RAM | 1 |
Moyen : 4 vCPU et 16 GB RAM | 2 |
Large : 8 vCPU et 32 GB RAM | 4 |
Extra large : 16 vCPU et 64 GB RAM | 8 |
Unités de capacité par heure pour les expérimentations AutoAI
Type de capacité | Unités de capacité par heure |
---|---|
8 vCPU et 32 Go de mémoire RAM | 20 |
Unités de capacité par heure pour les expériences d'Decision Optimization
Ces plans s'appliquent aux expériences d'Decision Optimization exécutées dans watsonx.ai Studio.
Type de capacité | Unités de capacité par heure |
---|---|
Decision Optimization : 2 vCPU et 8 Go de RAM | 6 |
Decision Optimization : 4 vCPU et 16 Go de RAM | 7 |
Decision Optimization: 8 vCPU et 32 GB RAM | 9 |
Decision Optimization : 16 vCPU et 64 Go de RAM | 13 |
Unités de capacité par heure pour l'Decision Optimization dans watsonx.ai Runtime
Ces plans s'appliquent à l'Decision Optimization déployée et exécutée à partir de watsonx.ai Runtime.
Type de capacité | Unités de capacité par heure |
---|---|
Decision Optimization : 2 vCPU et 8 Go de RAM | 30 |
Decision Optimization : 4 vCPU et 16 Go de RAM | 40 |
Decision Optimization: 8 vCPU et 32 GB RAM | 50 |
Decision Optimization : 16 vCPU et 64 Go de RAM | 60 |
Surveillance de l'utilisation des ressources
Vous pouvez suivre l'utilisation des ressources pour les biens que vous possédez ou sur lesquels vous collaborez dans le cadre d'un projet ou d'un espace. Si vous êtes propriétaire ou administrateur d'un compte, vous pouvez suivre les CUH pour un compte entier. Pour plus d'informations, voir Surveillance de l'utilisation des ressources du compte.
Vous pouvez suivre l'utilisation de la durée d'exécution pour un compte sur la page Environment Runtimes si vous êtes le propriétaire ou l'administrateur du compte IBM Cloud ou le propriétaire du service watsonx.ai Runtime. Pour plus d'informations, voir Surveillance des ressources.
Suivi de la consommation de CUH pour l'apprentissage automatique dans un ordinateur portable
Pour calculer les heures d'unité de capacité dans un carnet, utilisez :
CP = client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)
Par exemple :
'capacity_units': {'current': 19773430}
19773430/(3600*1000)
renvoie 5,49 CUH
Pour plus de détails, consultez la section Instances de service de la documentation de l' API IBM watsonx.ai Runtime .
En savoir plus
- Détails de la facturation pour les actifs d'IA générative
- Options de calcul pour les expérimentations AutoAI
- Options de calcul pour l'entraînement et l'évaluation de modèle
Sujet parent : plans d'exécution dewatsonx.ai