Options de calcul pour l'entraînement et l'évaluation (scoring) des modèles
Dernière mise à jour : 21 nov. 2024
Options de calcul pour l'entraînement et l'évaluation (scoring) des modèles
Lorsque vous entraînez ou évaluez (scoring) un modèle ou une fonction,
vous devez choisir le type, la taille et la puissance de la configuration matérielle répondant à vos besoins de calcul.
Choisissez la configuration matérielle de votre actif watsonx.ai Runtime lorsque vous formez l'actif ou lorsque vous le déployez.
Configurations matérielles disponibles pour l'entraînement et le déploiement des actifs
Type de capacité
Unités de capacité par heure
Très petit : 1x4 = 1 vCPU et 4 Go de RAM
0.5
Petit : 2x8 = 2 vCPU et 8 Go de RAM
1
Moyen : 4x16 = 4 vCPU et 16 Go de RAM
2
Grand : 8x32 = 8 vCPU et 32 Go de RAM
4
Très grand : 16x64 = 16 vCPU et 64 Go de RAM
8
Utilisation du calcul pour les actifs d'exécution de watsonx.ai
Copy link to section
Les déploiements et la notation consomment des ressources informatiques sous forme d'unités d'heures de capacité (CUH) à partir du service d'exécution watsonx.ai
Pour vérifier la consommation mensuelle totale de CUH pour vos services d'exécution watsonx.ai, dans le menu de navigation, sélectionnez Administration -> Environnement d'exécution.
En outre, vous pouvez surveiller l'utilisation mensuelle des ressources dans chaque espace de déploiement spécifique. Pour ce faire, à partir de votre espace de déploiement, accédez à l'onglet Gérer , puis sélectionnez Utilisation des ressources. Le récapitulatif affiche les CUH utilisées par type de déploiement: séparément pour les déploiements AutoAI , les déploiements d'apprentissage fédéré, les déploiements par lots et les déploiements en ligne.
L'utilisation de calcul en détail
Copy link to section
Le débit des CUH consommées est déterminé par les exigences de calcul de vos déploiements. Il est basé sur des variables telles que:
Type de déploiement
type de structure
complexité du scoring Mise à l'échelle d'un déploiement pour prendre en charge un plus grand nombre d'utilisateurs simultanés et les demandes augmentent également la consommation de CUH. Etant donné que de nombreuses variables affectent la consommation des ressources pour un déploiement, il est recommandé d'exécuter des tests sur vos modèles et déploiements pour analyser la consommation CUH.
La manière dont les déploiements en ligne consomment les unités de capacité dépend de l'infrastructure. Pour certaines infrastructures, les CUH sont facturées pour le nombre d'heures pendant lesquelles l'actif de déploiement est actif dans un espace de déploiement. Par exemple, les modèles SPSS en mode de déploiement en ligne qui s'exécutent pendant 24 heures par jour, sept jours par semaine, consomment des CUH et sont facturés pour cette période. Un déploiement en ligne actif n'a pas de temps d'inactivité. Pour les autres cadres, les CUH sont facturées en fonction de la durée d'évaluation. Consultez la table de consommation CUH pour plus de détails sur la façon dont l'utilisation de CUH est calculée.
Le temps de calcul est calculé à la milliseconde, avec un minimum d'1 minute pour chaque opération distincte. Par exemple :
Une exécution d'entraînement qui prend 12 secondes est facturée comme une minute
Une exécution d'entraînement qui prend 83.555 secondes est facturée exactement comme calculé
Consommation de CUH par type de déploiement et d'infrastructure
Copy link to section
La consommation de CUH est calculée à l'aide des formules suivantes:
Type de déploiement
Infrastructure
Calcul des CUH
En ligne
AutoAI, fonction IA, SPSS, bibliothèques personnalisées Scikit-Learn, Tensorflow, RShiny
Durée d'activité du déploiement * Nombre de noeuds * Taux CUH pour l'infrastructure de type de capacité
En ligne
Spark, PMML, Scikit-Learn, Pytorch, XGBoost
Durée d'évaluation en secondes * Nombre de noeuds * Taux CUH pour l'infrastructure de type de capacité
Lot
toutes les infrastructures
Durée du travail en secondes * Nombre de noeuds * Taux CUH pour l'infrastructure de type de capacité