Rubrique traduite automatiquement Vous pouvez passer à la version anglaiseVoir la clause de protection
Pour obtenir la version la plus précise et la plus à jour de cette documentation, voir la version anglaise (originale). IBM n'est pas responsable des dommages ou pertes résultant de l'utilisation du contenu traduit automatiquement (machine).
Détails de la facturation pour les actifs d'apprentissage automatique
Dernière mise à jour : 10 mars 2025
Détails de la facturation pour les actifs d'apprentissage automatique
Découvrez comment l'utilisation des ressources d'apprentissage automatique est mesurée à l'aide d'unités d'heures de capacité (CUH).
watsonx.ai Utilisation et tarification de l'informatique en temps réel
Copy link to section
watsonx.ai L'utilisation du calcul en temps réel est calculée par le nombre d'unités d'heures de capacité (CUH) consommées par une instance active d'apprentissage automatique. La quantité d'unités de capacité par heure consommées est déterminée par les exigences de calcul de vos actifs et modèles Machine Learning. Par exemple, un modèle présentant un jeu de données volumineux et complexe consommera davantage de ressources d'entraînement qu'un modèle présentant un jeu de données plus petit et plus simple. Notez que le dimensionnement d'un déploiement pour accepter davantage d'utilisateurs et de demandes simultanés augmente également la consommation de CUH.
Conseil : étant donné le grand nombre de variables qui affectent la consommation de ressources pour un déploiement, il est recommandé d'effectuer des tests sur vos modèles et déploiements afin d'analyser la consommation de CUH.
Pour tous les plans :
La consommation du taux de capacité-unité-heure (CUH) pour la formation est basée sur l'outil de formation, la spécification du matériel et l'environnement d'exécution.
La consommation du taux de capacité-unité-heure (CUH) pour le déploiement est basée sur le type de déploiement, la spécification du matériel et la spécification du logiciel.
watsonx.ai Runtime limite le nombre de travaux de déploiement retenus pour chaque espace de déploiement. Si vous dépassez votre limite, vous ne pourrez pas créer de nouvelles tâches de déploiement tant que vous n'aurez pas supprimé les tâches existantes ou mis à niveau votre plan. Par défaut, les métadonnées de travaux seront automatiquement supprimées au bout de 30 jours. Vous pouvez remplacer cette valeur lors de la création d'un travail. Voir Gestion des travaux.
Le délai d'inactivité correspond au temps nécessaire pour considérer qu'un déploiement est actif entre les demandes de notation. Si un déploiement ne reçoit pas de demandes d'évaluation pendant une certaine durée,
il est traité comme inactif, ou en veille, et la faccturation cesse pour toutes les infrastructures autres que SPSS.
Un plan prévoit au moins la limite de taux déclarée, et la limite de taux réelle peut être plus élevée que la limite déclarée. Par exemple, le plan Lite peut traiter plus de 2 demandes par seconde sans émettre d'erreur. Si vous disposez d'un plan payant et que vous pensez atteindre la limite de débit par erreur, contactez le support IBM pour obtenir de l'aide.
Le temps de calcul est calculé à la milliseconde près. Toutefois, il y a un minimum d'une minute pour chaque opération distincte. Ainsi, si une exécution
d'entraînement dure 12 secondes, elle sera comptabilisée comme si elle avait duré une minute dans le calcul du nombre d'unités de capacité-heures,
tandis qu'une exécution d'entraînement durant 83,555 secondes sera facturée sur la base de cette durée exacte.
La manière dont les déploiements en ligne consomment les unités de capacité dépend de l'infrastructure. Pour certaines infrastructures, les CUH sont facturées pour le nombre d'heures d'activité de l'actif de déploiement dans un espace de déploiement. Par exemple, les modèles SPSS en mode de déploiement en ligne qui fonctionnent 24 heures par jour pendant sept jours par semaine
consomment des unités de capacité-heures et sont facturés pour cette période. Il n'y pas de délai d'inactivité pour un déploiement en ligne actif. Pour les autres infrastructures, le CUH est facturé en fonction de la durée de l'évaluation. Pour le détail du calcul des CUH, voir le tableau de consommation de CUH.
Taux de consommation de CUH par type d'actif
Copy link to section
Tableau 3. Taux de consommation de CUH par type d'actif
Type d'actif
Type de capacité
Unités de capacité par heure
expérimentation AutoAI
8 vCPU et 32 Go de mémoire RAM
20
Formation à l'Decision Optimization
2 vCPU et 8 GB vCPU et 16 GB vCPU et 32 GB vCPU et 64 GB RAM
6 7 9 13
Déploiement de lDecision Optimization
2 vCPU et 8 GB vCPU et 16 GB vCPU et 32 GB vCPU et 64 GB RAM
30 40 50 60
d'Machine Learning (formation, évaluation ou notation)
1 vCPU et 4 GB vCPU et 8 GB vCPU et 16 GB vCPU et 32 GB vCPU et 64 GB RAM
0.5 1 2 4 8
Tuning Studio ' watsonx uniquement)
NVIDIA A100 80GB GPU
43
Consommation de CUH par type de déploiement et d'infrastructure
Copy link to section
La consommation de CUH est calculée avec les formules suivantes :
Type de déploiement
Infrastructure
Calcul des CUH
En ligne
AutoAI, AI function, service d'IA, SPSS, bibliothèques personnalisées Scikit-Learn, Tensorflow, RShiny
Prenons l'exemple d'une tâche de déploiement par lots de l Decision Optimization qui s'exécute pendant 15 minutes. La consommation de ressources est calculée de la manière suivante : 15 minutes = 0.25 heure, sur 2 nœuds, avec 2 vCPU et 8 Go de RAM. Cette combinaison se traduit par un taux de CUH de 30, de sorte que chaque fois que le travail est exécuté, il consomme 0.25 * 2 * 30, ce qui équivaut à 15 CUH.
Ces tableaux présentent le calcul des unités de capacité par heure pour des environnements d'apprentissage automatique prédéfinis, par type d'utilisation.
Unités de capacité par heure pour l'entraînement, l'évaluation ou le scoring des modèles
Copy link to section
Type de capacité
Unités de capacité par heure
Extra petit : 1 vCPU et 4 GB RAM
0.5
Petit : 2 vCPU et 8 GB RAM
1
Moyen : 4 vCPU et 16 GB RAM
2
Large : 8 vCPU et 32 GB RAM
4
Extra large : 16 vCPU et 64 GB RAM
8
Unités de capacité par heure pour les expérimentations AutoAI
Copy link to section
Type de capacité
Unités de capacité par heure
8 vCPU et 32 Go de mémoire RAM
20
Remarque :
AutoAI pour les solutions de génération augmentée par récupération (RAG) consomment également des jetons pour intégrer des documents et référencer les modèles de base. Pour plus de détails sur la facturation de l'IA générative, consultez Détails de facturation pour les ressources d'IA générative.
Unités de capacité par heure pour les expériences d'Decision Optimization
Copy link to section
Ces plans s'appliquent aux expériences d'Decision Optimization exécutées dans watsonx.ai Studio.
Type de capacité
Unités de capacité par heure
Decision Optimization : 2 vCPU et 8 Go de RAM
6
Decision Optimization : 4 vCPU et 16 Go de RAM
7
Decision Optimization: 8 vCPU et 32 GB RAM
9
Decision Optimization : 16 vCPU et 64 Go de RAM
13
Unités de capacité par heure pour l'Decision Optimization dans watsonx.ai Runtime
Copy link to section
Ces plans s'appliquent à l'Decision Optimization déployée et exécutée à partir de watsonx.ai Runtime.
Type de capacité
Unités de capacité par heure
Decision Optimization : 2 vCPU et 8 Go de RAM
30
Decision Optimization : 4 vCPU et 16 Go de RAM
40
Decision Optimization: 8 vCPU et 32 GB RAM
50
Decision Optimization : 16 vCPU et 64 Go de RAM
60
Surveillance de l'utilisation des ressources
Copy link to section
Vous pouvez suivre l'utilisation des ressources pour les biens que vous possédez ou sur lesquels vous collaborez dans le cadre d'un projet ou d'un espace. Si vous êtes propriétaire ou administrateur d'un compte, vous pouvez suivre les CUH pour un compte entier. Pour plus d'informations, voir Surveillance de l'utilisation des ressources du compte.
Vous pouvez suivre l'utilisation de la durée d'exécution pour un compte sur la page Environment Runtimes si vous êtes le propriétaire ou l'administrateur du compte IBM Cloud ou le propriétaire du service watsonx.ai Runtime. Pour plus d'informations, voir Surveillance des ressources.
Suivi de la consommation de CUH pour l'apprentissage automatique dans un ordinateur portable
Copy link to section
Pour calculer les heures d'unité de capacité dans un carnet, utilisez :