0 / 0
Retourner à la version anglaise de la documentation
Détails de la facturation pour les actifs d'apprentissage automatique
Dernière mise à jour : 05 déc. 2024
Détails de la facturation pour les actifs d'apprentissage automatique

Découvrez comment l'utilisation des ressources d'apprentissage automatique est mesurée à l'aide d'unités d'heures de capacité (CUH).

watsonx.ai Utilisation et tarification de l'informatique en temps réel

watsonx.ai L'utilisation du calcul en temps réel est calculée par le nombre d'unités d'heures de capacité (CUH) consommées par une instance active d'apprentissage automatique. La quantité d'unités de capacité par heure consommées est déterminée par les exigences de calcul de vos actifs et modèles Machine Learning. Par exemple, un modèle présentant un jeu de données volumineux et complexe consommera davantage de ressources d'entraînement qu'un modèle présentant un jeu de données plus petit et plus simple. Notez que le dimensionnement d'un déploiement pour accepter davantage d'utilisateurs et de demandes simultanés augmente également la consommation de CUH.

Conseil : étant donné le grand nombre de variables qui affectent la consommation de ressources pour un déploiement, il est recommandé d'effectuer des tests sur vos modèles et déploiements afin d'analyser la consommation de CUH.

Pour tous les plans :

  • La consommation du taux de capacité-unité-heure (CUH) pour la formation est basée sur l'outil de formation, la spécification du matériel et l'environnement d'exécution.
  • La consommation du taux de capacité-unité-heure (CUH) pour le déploiement est basée sur le type de déploiement, la spécification du matériel et la spécification du logiciel.
  • watsonx.ai Runtime limite le nombre de travaux de déploiement retenus pour chaque espace de déploiement. Si vous dépassez votre limite, vous ne pourrez pas créer de nouvelles tâches de déploiement tant que vous n'aurez pas supprimé les tâches existantes ou mis à niveau votre plan. Par défaut, les métadonnées de travaux seront automatiquement supprimées au bout de 30 jours. Vous pouvez remplacer cette valeur lors de la création d'un travail. Voir Gestion des travaux.
  • Le délai d'inactivité correspond au temps nécessaire pour considérer qu'un déploiement est actif entre les demandes de notation. Si un déploiement ne reçoit pas de demandes d'évaluation pendant une certaine durée, il est traité comme inactif, ou en veille, et la faccturation cesse pour toutes les infrastructures autres que SPSS.
  • Un plan prévoit au moins la limite de taux déclarée, et la limite de taux réelle peut être plus élevée que la limite déclarée. Par exemple, le plan Lite peut traiter plus de 2 demandes par seconde sans émettre d'erreur. Si vous disposez d'un plan payant et que vous pensez atteindre la limite de débit par erreur, contactez le support IBM pour obtenir de l'aide.
  • Le temps de calcul est calculé à la milliseconde près. Toutefois, il y a un minimum d'une minute pour chaque opération distincte. Ainsi, si une exécution d'entraînement dure 12 secondes, elle sera comptabilisée comme si elle avait duré une minute dans le calcul du nombre d'unités de capacité-heures, tandis qu'une exécution d'entraînement durant 83,555 secondes sera facturée sur la base de cette durée exacte.
  • La manière dont les déploiements en ligne consomment les unités de capacité dépend de l'infrastructure. Pour certaines infrastructures, les CUH sont facturées pour le nombre d'heures d'activité de l'actif de déploiement dans un espace de déploiement. Par exemple, les modèles SPSS en mode de déploiement en ligne qui fonctionnent 24 heures par jour pendant sept jours par semaine consomment des unités de capacité-heures et sont facturés pour cette période. Il n'y pas de délai d'inactivité pour un déploiement en ligne actif. Pour les autres infrastructures, le CUH est facturé en fonction de la durée de l'évaluation. Pour le détail du calcul des CUH, voir le tableau de consommation de CUH.

Taux de consommation de CUH par type d'actif

Tableau 3. Taux de consommation de CUH par type d'actif
Type d'actif Type de capacité Unités de capacité par heure
expérimentation AutoAI 8 vCPU et 32 Go de mémoire RAM 20
Formation à l'Decision Optimization 2 vCPU et 8 GB
vCPU et 16 GB
vCPU et 32 GB
vCPU et 64 GB RAM
6
7
9
13
Déploiement de lDecision Optimization 2 vCPU et 8 GB
vCPU et 16 GB
vCPU et 32 GB
vCPU et 64 GB RAM
30
40
50
60

d'Machine Learning (formation, évaluation ou notation)
1 vCPU et 4 GB
vCPU et 8 GB
vCPU et 16 GB
vCPU et 32 GB
vCPU et 64 GB RAM
0.5
1
2
4
8
Tuning Studio '
watsonx uniquement)
NVIDIA A100 80GB GPU 43

Consommation de CUH par type de déploiement et d'infrastructure

La consommation de CUH est calculée avec les formules suivantes :

Type de déploiement Infrastructure Calcul des CUH
En ligne AutoAI, fonction IA, SPSS, bibliothèques personnalisées Scikit-Learn, Tensorflow, RShiny durée_active_du_déploiement_en_heures * no_of_nodes * CUH_rate_for_capacity_type_framework
En ligne Spark, PMML, Scikit-Learn, Pytorch, XGBoost score_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_framework
Lot toutes les infrastructures job_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_framework

Prenons l'exemple d'une tâche de déploiement par lots de l Decision Optimization qui s'exécute pendant 15 minutes. La consommation de ressources est calculée de la manière suivante : 15 minutes = 0.25 heure, sur 2 nœuds, avec 2 vCPU et 8 Go de RAM. Cette combinaison se traduit par un taux de CUH de 30, de sorte que chaque fois que le travail est exécuté, il consomme 0.25 * 2 * 30, ce qui équivaut à 15 CUH.

Ces tableaux présentent le calcul des unités de capacité par heure pour des environnements d'apprentissage automatique prédéfinis, par type d'utilisation.

Unités de capacité par heure pour l'entraînement, l'évaluation ou le scoring des modèles

Type de capacité Unités de capacité par heure
Extra petit : 1 vCPU et 4 GB RAM 0.5
Petit : 2 vCPU et 8 GB RAM 1
Moyen : 4 vCPU et 16 GB RAM 2
Large : 8 vCPU et 32 GB RAM 4
Extra large : 16 vCPU et 64 GB RAM 8

 

Unités de capacité par heure pour les expérimentations AutoAI

Type de capacité Unités de capacité par heure
8 vCPU et 32 Go de mémoire RAM 20

 

Unités de capacité par heure pour les expériences d'Decision Optimization

Ces plans s'appliquent aux expériences d'Decision Optimization exécutées dans watsonx.ai Studio.

Type de capacité Unités de capacité par heure
Decision Optimization : 2 vCPU et 8 Go de RAM 6
Decision Optimization : 4 vCPU et 16 Go de RAM 7
Decision Optimization: 8 vCPU et 32 GB RAM 9
Decision Optimization : 16 vCPU et 64 Go de RAM 13

 

Unités de capacité par heure pour l'Decision Optimization dans watsonx.ai Runtime

Ces plans s'appliquent à l'Decision Optimization déployée et exécutée à partir de watsonx.ai Runtime.

Type de capacité Unités de capacité par heure
Decision Optimization : 2 vCPU et 8 Go de RAM 30
Decision Optimization : 4 vCPU et 16 Go de RAM 40
Decision Optimization: 8 vCPU et 32 GB RAM 50
Decision Optimization : 16 vCPU et 64 Go de RAM 60

Surveillance de l'utilisation des ressources

Vous pouvez suivre l'utilisation des ressources pour les biens que vous possédez ou sur lesquels vous collaborez dans le cadre d'un projet ou d'un espace. Si vous êtes propriétaire ou administrateur d'un compte, vous pouvez suivre les CUH pour un compte entier. Pour plus d'informations, voir Surveillance de l'utilisation des ressources du compte.

Vous pouvez suivre l'utilisation de la durée d'exécution pour un compte sur la page Environment Runtimes si vous êtes le propriétaire ou l'administrateur du compte IBM Cloud ou le propriétaire du service watsonx.ai Runtime. Pour plus d'informations, voir Surveillance des ressources.

Suivi de la consommation de CUH pour l'apprentissage automatique dans un ordinateur portable

Pour calculer les heures d'unité de capacité dans un carnet, utilisez :

CP =  client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)

Par exemple :

'capacity_units': {'current': 19773430}

19773430/(3600*1000)

renvoie 5,49 CUH

Pour plus de détails, consultez la section Instances de service de la documentation de l' API IBM watsonx.ai Runtime .

En savoir plus

Sujet parent : plans d'exécution dewatsonx.ai

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus