0 / 0
Retourner à la version anglaise de la documentation
Options de calcul pour l'entraînement et l'évaluation (scoring) des modèles
Dernière mise à jour : 21 nov. 2024
Options de calcul pour l'entraînement et l'évaluation (scoring) des modèles

Lorsque vous entraînez ou évaluez (scoring) un modèle ou une fonction, vous devez choisir le type, la taille et la puissance de la configuration matérielle répondant à vos besoins de calcul.

Configurations matérielles par défaut

Choisissez la configuration matérielle de votre actif watsonx.ai Runtime lorsque vous formez l'actif ou lorsque vous le déployez.

Configurations matérielles disponibles pour l'entraînement et le déploiement des actifs
Type de capacité Unités de capacité par heure
Très petit : 1x4 = 1 vCPU et 4 Go de RAM 0.5
Petit : 2x8 = 2 vCPU et 8 Go de RAM 1
Moyen : 4x16 = 4 vCPU et 16 Go de RAM 2
Grand : 8x32 = 8 vCPU et 32 Go de RAM 4
Très grand : 16x64 = 16 vCPU et 64 Go de RAM 8

Utilisation du calcul pour les actifs d'exécution de watsonx.ai

Les déploiements et la notation consomment des ressources informatiques sous forme d'unités d'heures de capacité (CUH) à partir du service d'exécution watsonx.ai

Pour vérifier la consommation mensuelle totale de CUH pour vos services d'exécution watsonx.ai, dans le menu de navigation, sélectionnez Administration -> Environnement d'exécution.

En outre, vous pouvez surveiller l'utilisation mensuelle des ressources dans chaque espace de déploiement spécifique. Pour ce faire, à partir de votre espace de déploiement, accédez à l'onglet Gérer , puis sélectionnez Utilisation des ressources. Le récapitulatif affiche les CUH utilisées par type de déploiement: séparément pour les déploiements AutoAI , les déploiements d'apprentissage fédéré, les déploiements par lots et les déploiements en ligne.

L'utilisation de calcul en détail

Le débit des CUH consommées est déterminé par les exigences de calcul de vos déploiements. Il est basé sur des variables telles que:

  • Type de déploiement
  • type de structure
  • complexité du scoring Mise à l'échelle d'un déploiement pour prendre en charge un plus grand nombre d'utilisateurs simultanés et les demandes augmentent également la consommation de CUH. Etant donné que de nombreuses variables affectent la consommation des ressources pour un déploiement, il est recommandé d'exécuter des tests sur vos modèles et déploiements pour analyser la consommation CUH.

La manière dont les déploiements en ligne consomment les unités de capacité dépend de l'infrastructure. Pour certaines infrastructures, les CUH sont facturées pour le nombre d'heures pendant lesquelles l'actif de déploiement est actif dans un espace de déploiement. Par exemple, les modèles SPSS en mode de déploiement en ligne qui s'exécutent pendant 24 heures par jour, sept jours par semaine, consomment des CUH et sont facturés pour cette période. Un déploiement en ligne actif n'a pas de temps d'inactivité. Pour les autres cadres, les CUH sont facturées en fonction de la durée d'évaluation. Consultez la table de consommation CUH pour plus de détails sur la façon dont l'utilisation de CUH est calculée.

Le temps de calcul est calculé à la milliseconde, avec un minimum d'1 minute pour chaque opération distincte. Par exemple :

  • Une exécution d'entraînement qui prend 12 secondes est facturée comme une minute
  • Une exécution d'entraînement qui prend 83.555 secondes est facturée exactement comme calculé

Consommation de CUH par type de déploiement et d'infrastructure

La consommation de CUH est calculée à l'aide des formules suivantes:

Type de déploiement Infrastructure Calcul des CUH
En ligne AutoAI, fonction IA, SPSS, bibliothèques personnalisées Scikit-Learn, Tensorflow, RShiny Durée d'activité du déploiement * Nombre de noeuds * Taux CUH pour l'infrastructure de type de capacité
En ligne Spark, PMML, Scikit-Learn, Pytorch, XGBoost Durée d'évaluation en secondes * Nombre de noeuds * Taux CUH pour l'infrastructure de type de capacité
Lot toutes les infrastructures Durée du travail en secondes * Nombre de noeuds * Taux CUH pour l'infrastructure de type de capacité

En savoir plus

Rubrique parent: Gestion des déploiements prédictifs

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus