Lorsque vous déployez certains actifs dans watsonx.ai Runtime, vous pouvez choisir le type, la taille et la puissance de la configuration matérielle qui correspond à vos besoins informatiques.
Création de spécifications matérielles pour les déploiements
Vous pouvez créer des spécifications matérielles pour vos déploiements de l'une des manières suivantes:
- Bibliothèque clientPython : utilisez la fonction
hardware_specifications.store
de la bibliothèque client Python . Pour plus d'informations, voir Référence de la bibliothèque clientPython - API de base commune pour les données et l'IA : Utilisez "
POST /v2/hardware_specifications
dans la liste des environnements de l'API de base commune pour les données et l'IA afin de créer une spécification matérielle. Pour plus d'informations, voir Référence de l'API des environnements.
Types de déploiement nécessitant des spécifications matérielles
La sélection d'une spécification matérielle est disponible pour tous les types de déploiement par lots . Pour les déploiements en ligne, vous pouvez sélectionner une spécification matérielle spécifique si vous déployez:
- Fonctions Python
- Modèles Tensorflow
- Modèles avec des spécifications logicielles personnalisées
Configurations matérielles disponibles pour le déploiement d'actifs
XS
: 1x4 = 1 vCPU et 4 Go de RAMS
: 2x8 = 2 vCPU et 8 Go de RAMM
: 4x16 = 4 vCPU et 16 Go de mémoire RAML
: 8x32 = 8 vCPU et 32 Go de RAMXL
: 16x64 = 16 vCPU et 64 Go de mémoire RAM
Vous pouvez utiliser la configuration XS
pour déployer:
- Fonctions Python
- Scripts Python
- Scripts R
- Modèles basés sur des bibliothèques personnalisées et des images personnalisées
Pour les déploiements Decision Optimization , vous pouvez utiliser les spécifications matérielles suivantes:
S
M
L
XL
Spécifications matérielles pour l'inférence de processeur graphique
À partir de la version 4.8.5 de Cloud Pak for Data, vous pouvez sélectionner les spécifications matérielles du GPU pour les spécifications logicielles CUDA à partir de l'interface utilisateur sur la plateforme " x86
lorsque vous créez un déploiement.
Utilisez les spécifications matérielles prédéfinies suivantes pour l'inférence de processeur graphique:
En savoir plus
Rubrique parent: Gestion des déploiements prédictifs