0 / 0
Retourner à la version anglaise de la documentation
Gestion des spécifications matérielles pour les déploiements
Dernière mise à jour : 09 déc. 2024
Gestion des spécifications matérielles pour les déploiements

Lorsque vous déployez certains actifs dans watsonx.ai Runtime, vous pouvez choisir le type, la taille et la puissance de la configuration matérielle qui correspond à vos besoins informatiques.

Création de spécifications matérielles pour les déploiements

Vous pouvez créer des spécifications matérielles pour vos déploiements de l'une des manières suivantes:

  • Bibliothèque clientPython : utilisez la fonction hardware_specifications.store de la bibliothèque client Python . Pour plus d'informations, voir Référence de la bibliothèque clientPython
  • API de base commune pour les données et l'IA : Utilisez " POST /v2/hardware_specifications dans la liste des environnements de l'API de base commune pour les données et l'IA afin de créer une spécification matérielle. Pour plus d'informations, voir Référence de l'API des environnements.

Types de déploiement nécessitant des spécifications matérielles

La sélection d'une spécification matérielle est disponible pour tous les types de déploiement par lots . Pour les déploiements en ligne, vous pouvez sélectionner une spécification matérielle spécifique si vous déployez:

  • Fonctions Python
  • Modèles Tensorflow
  • Modèles avec des spécifications logicielles personnalisées

Configurations matérielles disponibles pour le déploiement d'actifs

  • XS: 1x4 = 1 vCPU et 4 Go de RAM
  • S: 2x8 = 2 vCPU et 8 Go de RAM
  • M: 4x16 = 4 vCPU et 16 Go de mémoire RAM
  • L: 8x32 = 8 vCPU et 32 Go de RAM
  • XL: 16x64 = 16 vCPU et 64 Go de mémoire RAM

Vous pouvez utiliser la configuration XS pour déployer:

  • Fonctions Python
  • Scripts Python
  • Scripts R
  • Modèles basés sur des bibliothèques personnalisées et des images personnalisées

Pour les déploiements Decision Optimization , vous pouvez utiliser les spécifications matérielles suivantes:

  • S
  • M
  • L
  • XL

Spécifications matérielles pour l'inférence de processeur graphique

À partir de la version 4.8.5 de Cloud Pak for Data, vous pouvez sélectionner les spécifications matérielles du GPU pour les spécifications logicielles CUDA à partir de l'interface utilisateur sur la plateforme " x86 lorsque vous créez un déploiement.

Utilisez les spécifications matérielles prédéfinies suivantes pour l'inférence de processeur graphique:

En savoir plus

Rubrique parent: Gestion des déploiements prédictifs

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus