Plans et utilisation du calcul Watson Machine Learning

Vous utilisez des ressources Watson Machine Learning, mesurées en unités de capacité-heures (CUH), lorsque vous entraînez des modèles AutoAI, exécutez des expérimentations d'apprentissage en profondeur et demandez des prédictions à partir de modèles déployés. Cette rubrique décrit les différents plans que vous pouvez choisir et les services inclus dans chacun. Elle fournit également la liste des environnements de calcul par défaut pour vous aider à choisir le plan qui correspond à vos besoins. Cette rubrique décrit :

CUH (Capacity Unit Hours)

CUH (Capacity Unit-Hour) est une mesure de la consommation de ressources exprimée en unités de capacité-heures. Tous les plans Watson Machine Learning l'utilisent, ce qui facilite le suivi de la consommation de ressources.

Plans Watson Machine Learning

{: #wml-plan}Les plans Watson Machine Learning régissent le mode de facturation qui vous est appliqué pour les modèles que vous entraînez et déployez à l'aide de Watson Machine Learning. Choisissez un plan en fonction de vos besoins :

  • Lite est un forfait gratuit avec une capacité limitée. Choisissez ce plan si vous évaluez Watson Machine Learning et souhaitez tester ses fonctions.
  • Standard est un plan par répartition qui vous permet de générer, déployer et gérer des modèles répondant à vos besoins.
  • Professionnel est un plan d'entreprise à taux fixe de grande capacité conçu pour répondre à tous les besoins d'apprentissage automatique d'une organisation. Le plan Professional assure également la prise en charge de la loi HIPAA s'il est mis à disposition dans la région de Dallas.

Pour plus d'informations sur la planification et la tarification, voir la machine d'apprentissage IBM Cloud.

Remarque : Si vous effectuez une mise à niveau de Standard vers Professional, vous ne pouvez pas revenir ensuite à un plan standard. Dans ce cas, contactez le support IBM pour obtenir de l'aide.

Plans par CUH

Planification Heures d'unité de capacité incluses Excédent Nombre maximal de travaux de déploiement
par espace
Lite 20 par mois Aucun dépassement d'autorisé 100
Standard Facturé à l'unité de capacité-heure (CUH) Facturé à l'unité de capacité-heure (CUH) 1000
Professional 2 500 Facturation de l'excédent d'unités de capacité-heures consommé 3000 (augmentation sur demande au support)

Limites et valeurs par défaut pour la conservation des travaux de déploiement (Watson Machine Learning)

Watson Machine Learning place les limites sur le nombre de travaux de déploiement conservés pour chaque espace de déploiement. Notamment, grâce à cette mise à jour, aucune de vos informations ne sera perdue, mais il sera peut-être nécessaire de modifier votre expérience utilisateur lors de l'exécution de travaux de déploiement.

Si vous dépassez la limite, vous ne pourrez pas créer de nouveaux travaux de déploiement tant que vous n'avez pas supprimé des travaux existants ou que vous n'avez pas mis à niveau votre plan. La nouvelle automatisation vous aidera à respecter les limites du plan. Par défaut, les métadonnées de travaux seront automatiquement supprimées au bout de 30 jours. Vous pouvez remplacer cette valeur lors de la création d'un travail. Voir Gestion des travaux.

Utilisation du calcul et tarification Watson Machine Learning

Remarque : Pour plus d'informations sur la tarification, voir Watson Machine Learning : Tarification

Détails de l'utilisation des CUH

  • L'utilisation du calcul Machine Learning est calculée en nombre d'unités de capacité-heures (CUH) consommées par une instance d'apprentissage automatique active.
  • La quantité d'unités de capacité par heure consommées est déterminée par les exigences de calcul de vos actifs et modèles Machine Learning. Par exemple, un modèle présentant un jeu de données volumineux et complexe consommera davantage de ressources d'entraînement qu'un modèle présentant un jeu de données plus petit et plus simple. Notez que le dimensionnement d'un déploiement pour accepter davantage d'utilisateurs et de demandes simultanés augmente également la consommation de CUH.
  • Comme il y a tellement de variables qui affectent la consommation de ressources pour un déploiement, nous vous recommandons d'exécuter des tests sur vos modèles et déploiements pour analyser la consommation de CUH.
  • Le temps de calcul est calculé à la milliseconde près. Toutefois, il y a un minimum d'une minute pour chaque opération distincte. Ainsi, si une exécution d'entraînement dure 12 secondes, elle sera comptabilisée comme si elle avait duré une minute dans le calcul du nombre d'unités de capacité-heures, tandis qu'une exécution d'entraînement durant 83,555 secondes sera facturée sur la base de cette durée exacte.
  • La manière dont les déploiements en ligne consomment les unités de capacité dépend de l'infrastructure. Pour certaines infrastructures, les CUH sont facturées pour le nombre d'heures d'activité de l'actif de déploiement dans un espace de déploiement. Par exemple, les modèles SPSS en mode de déploiement en ligne qui fonctionnent 24 heures par jour pendant sept jours par semaine consomment des unités de capacité-heures et sont facturés pour cette période. Il n'y pas de délai d'inactivité pour un déploiement en ligne actif. Pour les autres infrastructures, le CUH est facturé en fonction de la durée de l'évaluation. Pour le détail du calcul des CUH, voir le tableau de consommation de CUH.

Détermination de l'activité ou non d'un déploiement

Si un déploiement ne reçoit pas de demandes d'évaluation pendant une certaine durée, il est traité comme inactif, ou en veille, et la faccturation cesse pour toutes les infrastructures autres que SPSS. La période utilisée pour déterminer quand un déploiement est inactif dépend du type de plan.

Type de plan Délai pour l'inactivité
Lite 1 jour
Standard 3 jours
Professional 3 jours

Consommation de CUH par type de déploiement et d'infrastructure

La consommation de CUH est calculée avec les formules suivantes :

Type de déploiement Infrastructure Calcul des CUH
En ligne AutoAI, fonction IA, SPSS, bibliothèques personnalisées Scikit-Learn, Tensorflow, RShiny durée_activité_déploiement nb_de_noeuds taux_CUH_pour_type_capacité_framework
En ligne Spark, PMML, Scikit-Learn, Pytorch, XGBoost durée_scoring_en_secondes nb_de_noeuds taux_CUH_pour_type_capacité_framework
Lot toutes les infrastructures durée_travail_en_secondes nb_de_noeuds taux_CUH_pour_type_capacité_framework

Les tableaux ci-dessous illustrent le calcul des unités de capacité par heure pour les environnements d'apprentissage automatique, par type d'utilisation.

Unités de capacité par heure pour les expérimentations d'apprentissage en profondeur

Type de capacité Unités de Capacité par heure
1 (une) GPU NVIDIA K80 2
1 (une) GPU NVIDIA V100 10

Unités de capacité par heure pour l'entraînement, l'évaluation ou le scoring des modèles

Type de capacité Unités de Capacité par heure
Très petit : 1x4 = 1 vCPU et 4 Go de RAM 0,5
Petit : 2x8 = 2 vCPU et 8 Go de RAM 1
Moyen : 4x16 = 4 vCPU et 16 Go de RAM 2
Grand : 8x32 = 8 vCPU et 32 Go de RAM 4
Très grand : 16x64 = 16 vCPU et 64 Go de RAM 8

Unités de capacité par heure pour les expérimentations AutoAI

Lorsque des données sont jointes dans une expérimentation AutoAI, le nombre d'unités de capacité par heure (CUH) est calculé différemment pendant la jointure des données. Une fois les données jointes, la consommation de CUH est à nouveau calculée sur la base d'une expérimentation à une seule source de données.

Unités de capacité par heure pour les expérimentations AutoAI à l'aide d'une seule source de données :

Type de capacité Unités de Capacité par heure
8 vCPU et 32 Go de mémoire RAM 20

Unités de capacité par heure pour les expérimentations AutoAI lors de l'intégration des données :

Notez que la consommation augmente avec chaque exécuteur que vous ajoutez.

Type de capacité Unités de Capacité par heure
Jointure avec 1 Driver : 2 vCPU et 8 Go de RAM + 1 Exécuteur : 2 vCPU et 8 Go de RAM 10
Jointure avec exécuteurs additionnels 5 CUH par exécuteur additionnel
Après jointure des données : 8 vCPU et 32 Go de RAM 20

Unités de capacité par heure pour Decision Optimization

Type de capacité Unités de Capacité par heure
Decision Optimization : 2 vCPU et 8 Go de RAM 30
Decision Optimization : 4 vCPU et 16 Go de RAM 40
Decision Optimization : 16 vCPU et 64 Go de RAM 60

Pour plus de détails sur la façon dont les ressources sont consommées, voir Surveillance de l'utilisation des ressources de compte

Suivi de la consommation de CUH pour un compte

Vous pouvez suivre l'utilisation de l'environnement d'exécution pour un compte sur la page Environnements d'exécution si vous êtes le propriétaire ou l'administrateur du compte IBM Cloud ou le propriétaire du service Watson Machine Learning. Pour plus d'informations, voir Ressource de surveillance.

Suivi de la consommation de CUH pour l'apprentissage automatique dans un bloc-notes (notebook)

Pour calculer les unités de capacité-heures, utilisez :

CP =  client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)

Par exemple :

'capacity_units': {'current': 19773430}

19773430/(3600*1000)

renvoie 5,49 CUH

Pour plus d'informations, voir la section Instances de service de la documentation API IBM Watson Machine Learning.

En savoir plus

Rubrique parent : Watson Machine Learning