Gestion des spécifications matérielles pour les déploiements
Lorsque vous déployez certains actifs dans watsonx.ai Runtime, vous pouvez choisir le type, la taille et la puissance de la configuration matérielle qui correspond à vos besoins informatiques.
Création de spécifications matérielles pour les déploiements
Vous pouvez créer des spécifications matérielles pour vos déploiements de l'une des manières suivantes:
- Bibliothèque clientPython : utilisez la fonction
de la bibliothèque client Python . Pour plus d'informations, voir Référence de la bibliothèque clientPythonhardware_specifications.store
- API de base commune pour les données et l'IA : Utilisez "
dans la liste des environnements de l'API de base commune pour les données et l'IA afin de créer une spécification matérielle. Pour plus d'informations, voir Référence de l'API des environnements.POST /v2/hardware_specifications
Types de déploiement nécessitant des spécifications matérielles
La sélection d'une spécification matérielle est disponible pour tous les types de déploiement par lots . Pour les déploiements en ligne, vous pouvez sélectionner une spécification matérielle spécifique si vous déployez:
- Fonctions Python
- Modèles Tensorflow
- Modèles avec des spécifications logicielles personnalisées
Configurations matérielles disponibles pour le déploiement d'actifs
: 1x4 = 1 vCPU et 4 Go de RAMXS
: 2x8 = 2 vCPU et 8 Go de RAMS
: 4x16 = 4 vCPU et 16 Go de mémoire RAMM
: 8x32 = 8 vCPU et 32 Go de RAML
: 16x64 = 16 vCPU et 64 Go de mémoire RAMXL
Vous pouvez utiliser la configuration
pour déployer:XS
- Fonctions Python
- Scripts Python
- Scripts R
- Modèles basés sur des bibliothèques personnalisées et des images personnalisées
Pour les déploiements Decision Optimization , vous pouvez utiliser les spécifications matérielles suivantes:
S
M
L
XL
En savoir plus
Rubrique parent: Gestion des déploiements prédictifs