Lorsque vous entraînez ou évaluez (scoring) un modèle ou une fonction, vous devez choisir le type, la taille et la puissance de la configuration matérielle répondant à vos besoins de calcul.
Configurations matérielles par défaut
Choisissez la configuration matérielle de votre actif watsonx.ai Runtime lorsque vous formez l'actif ou lorsque vous le déployez.
Type de capacité | Unités de capacité par heure |
---|---|
Très petit : 1x4 = 1 vCPU et 4 Go de RAM | 0.5 |
Petit : 2x8 = 2 vCPU et 8 Go de RAM | 1 |
Moyen : 4x16 = 4 vCPU et 16 Go de RAM | 2 |
Grand : 8x32 = 8 vCPU et 32 Go de RAM | 4 |
Très grand : 16x64 = 16 vCPU et 64 Go de RAM | 8 |
Utilisation du calcul pour les actifs d'exécution de watsonx.ai
Les déploiements et la notation consomment des ressources informatiques sous forme d'unités d'heures de capacité (CUH) à partir du service d'exécution watsonx.ai
Pour vérifier la consommation mensuelle totale de CUH pour vos services d'exécution watsonx.ai, dans le menu de navigation, sélectionnez Administration -> Environnement d'exécution.
En outre, vous pouvez surveiller l'utilisation mensuelle des ressources dans chaque espace de déploiement spécifique. Pour ce faire, à partir de votre espace de déploiement, accédez à l'onglet Gérer , puis sélectionnez Utilisation des ressources. Le récapitulatif affiche les CUH utilisées par type de déploiement: séparément pour les déploiements AutoAI , les déploiements d'apprentissage fédéré, les déploiements par lots et les déploiements en ligne.
L'utilisation de calcul en détail
Le débit des CUH consommées est déterminé par les exigences de calcul de vos déploiements. Il est basé sur des variables telles que:
- Type de déploiement
- type de structure
- complexité du scoring Mise à l'échelle d'un déploiement pour prendre en charge un plus grand nombre d'utilisateurs simultanés et les demandes augmentent également la consommation de CUH. Etant donné que de nombreuses variables affectent la consommation des ressources pour un déploiement, il est recommandé d'exécuter des tests sur vos modèles et déploiements pour analyser la consommation CUH.
La manière dont les déploiements en ligne consomment les unités de capacité dépend de l'infrastructure. Pour certaines infrastructures, les CUH sont facturées pour le nombre d'heures pendant lesquelles l'actif de déploiement est actif dans un espace de déploiement. Par exemple, les modèles SPSS en mode de déploiement en ligne qui s'exécutent pendant 24 heures par jour, sept jours par semaine, consomment des CUH et sont facturés pour cette période. Un déploiement en ligne actif n'a pas de temps d'inactivité. Pour les autres cadres, les CUH sont facturées en fonction de la durée d'évaluation. Consultez la table de consommation CUH pour plus de détails sur la façon dont l'utilisation de CUH est calculée.
Le temps de calcul est calculé à la milliseconde, avec un minimum d'1 minute pour chaque opération distincte. Par exemple :
- Une exécution d'entraînement qui prend 12 secondes est facturée comme une minute
- Une exécution d'entraînement qui prend 83.555 secondes est facturée exactement comme calculé
Consommation de CUH par type de déploiement et d'infrastructure
La consommation de CUH est calculée à l'aide des formules suivantes:
Type de déploiement | Infrastructure | Calcul des CUH |
---|---|---|
En ligne | AutoAI, fonction IA, SPSS, bibliothèques personnalisées Scikit-Learn, Tensorflow, RShiny | Durée d'activité du déploiement * Nombre de noeuds * Taux CUH pour l'infrastructure de type de capacité |
En ligne | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | Durée d'évaluation en secondes * Nombre de noeuds * Taux CUH pour l'infrastructure de type de capacité |
Lot | toutes les infrastructures | Durée du travail en secondes * Nombre de noeuds * Taux CUH pour l'infrastructure de type de capacité |
En savoir plus
- Déploiement d'actifs
- service d'exécutionwatsonx.ai
- Surveillance de l'utilisation des ressources du compte
Rubrique parent: Gestion des déploiements prédictifs