En utilisant IBM watsonx.ai Runtime, vous pouvez déployer des modèles d'apprentissage automatique, des scripts, des fonctions . Après avoir créé des déploiements, vous pouvez les tester et les gérer, et préparer vos actifs pour le déploiement dans des environnements de préproduction et de production afin de générer des prévisions et des connaissances.
Service The administrator must provision the watsonx.ai Runtime service on Cloud Pak for Data as a Service platform to use its capabilities.
Processus de déploiement
Le processus standard de déploiement d'un actif est le suivant:
- Choisir le type de déploiement: choisissez un type de déploiement pour le type d'actif que vous souhaitez déployer.
- Créer un déploiement: en fonction du type d'actif, vous pouvez créer un déploiement en ligne, par lots, par application ou détaché.
- Tester le déploiement: Vous pouvez tester vos déploiements en entrant des données de test, en fournissant du contenu JSON ou en créant un travail par lots.
- Extraire le noeud final de déploiement: pour utiliser votre déploiement dans une application, vous devez extraire le noeud final de votre déploiement. Le noeud final de modèle permet d'accéder à une interface pour appeler et gérer les déploiements de modèle.
Le graphique suivant illustre le processus de déploiement des actifs d'IA:
Types de déploiement
Les types de déploiement les plus courants sont les suivants:
Déploiement en ligne: créez un déploiement en ligne pour traiter les données d'entrée en temps réel. Pour tester le déploiement en ligne en temps réel, vous pouvez soumettre de nouvelles données client au noeud final de déploiement afin d'obtenir une prévision en temps réel.
Déploiement par lots: Créez un déploiement par lots pour traiter un grand lot de données d'entrée à partir d'une source de données et écrivez la sortie dans une destination sélectionnée. Vous pouvez configurer le travail de déploiement par lots et l'exécuter selon un planning ou à la demande.
Types d'actifs déployables
Le type d'actif que vous déployez détermine le type de déploiement que vous pouvez créer. Par exemple, les fonctions, les scripts et les modèles Python , tels que AutoAI ou Decision Optimization , prennent en charge les déploiements en ligne et par lots. Toutefois, vous pouvez créer des déploiements en ligne uniquement pour les modèles importés à partir d'un fichier. Les différents types d'actifs déployables sont les suivants:
- watsonx.ai Actifs d'exécution: Vous pouvez déployer des actifs de machine learning 'watsonx.ai Runtime tels que des fonctions 'Python, des applications R Shiny, des modèles NLP, des scripts, et plus encore avec 'watsonx.ai Runtime.
- Modèles d'Decision Optimization: Vous pouvez déployer un modèle d'Decision Optimization avec watsonx.ai Runtime.
Méthodes de déploiement des actifs
Vous pouvez déployer et gérer vos actifs de l'une des manières suivantes:
Déployez et gérez des actifs dans un espace de déploiement à l'aide d'une approche sans code.
Déployez et gérez les actifs à l'aide d'un programme à l'aide d'une approche de code personnalisé.
Déploiement et gestion des actifs dans les espaces de déploiement
Créez un espace de déploiement pour collaborer avec les parties prenantes et déployez et gérez des actifs dans un espace de déploiement.
Pour gérer vos actifs dans un espace de déploiement, vous devez promouvoir vos actifs d'un projet vers votre espace de déploiement. Vous pouvez également importer ou exporter des actifs à partir de votre espace de déploiement.
Utilisez le tableau de bord des déploiements pour obtenir une vue agrégée de vos déploiements et surveiller l'activité de déploiement.
Déploiement et gestion des actifs à l'aide d'un programme
Vous pouvez déployer et gérer des actifs en utilisant la bibliothèque client Python ou l'API d'exécution watsonx.ai Pour plus d'informations, voir Déploiement programmatique des ressources d'IA.
Gestion des infrastructures et des spécifications logicielles pour les déploiements
Les spécifications et infrastructures logicielles contiennent des bundles de packages avec les versions correspondantes des packages.
Vous pouvez utiliser des spécifications logicielles prédéfinies ou créer des spécifications logicielles personnalisées en ajoutant de nouveaux packages à des infrastructures existantes, en créant de nouveaux packages ou en mettant à jour des versions de package dans des spécifications logicielles.
En savoir plus
Rubrique parent: Déploiement et gestion d'actifs d'IA