A l'aide d' IBM Watson Machine Learning, vous pouvez déployer des modèles d'apprentissage automatique, des scripts et des fonctions, ainsi que des modèles d'invite pour les modèles d'IA génératifs. Après avoir créé des déploiements, vous pouvez les tester et les gérer, et préparer vos actifs pour le déploiement dans des environnements de préproduction et de production afin de générer des prévisions et des connaissances.
Service L'administrateur doit mettre à disposition le service Watson Machine Learning sur la plateforme watsonx pour utiliser ses capacités.
Déploiement et gestion des actifs dans les espaces de déploiement
Créez un espace de déploiement pour collaborer avec les parties prenantes et déployez et gérez vos actifs d'IA. Pour gérer vos actifs dans un espace de déploiement, vous devez promouvoir vos actifs d'un projet vers votre espace de déploiement. Vous pouvez également importer ou exporter des actifs à partir de votre espace de déploiement. Pour plus d'informations, reportez-vous à la page relative aux espaces de déploiement.
Le graphique suivant illustre les activités typiques de déploiement d'actifs d'intelligence artificielle:
Méthodes de déploiement des actifs
Vous pouvez déployer et gérer vos actifs de l'une des manières suivantes:
Utiliser une approche sans code: Vous pouvez utiliser une approche sans code pour déployer et gérer des actifs dans un espace de déploiement. Pour plus d'informations, voir Déploiement et gestion d'actifs dans des espaces de déploiement
Utiliser une approche par code personnalisé Vous pouvez utiliser une approche par code personnalisé pour déployer et gérer des actifs à l'aide d'un programme en utilisant:
Pour des API watsonx supplémentaires, voir APIwatsonx.
Types de déploiement
En fonction des besoins de votre organisation, vous pouvez créer un déploiement en ligne ou par lots:
Déploiement en ligne: Créez un déploiement en ligne pour traiter les données d'entrée en temps réel. Pour tester le déploiement en ligne en temps réel, vous pouvez soumettre de nouvelles données client au noeud final de déploiement afin d'obtenir une prévision en temps réel. Vous pouvez tester votre déploiement en ligne en entrant des données de test dans un formulaire ou via un code JSON. Pour plus d'informations, voir Création de déploiements en ligne dans Watson Machine Learning.
Déploiement par lots: Créez un déploiement par lots pour traiter un grand lot de données d'entrée à partir d'une source de données et écrire la sortie dans une destination sélectionnée. Pour tester votre déploiement par lots, vous devez créer un travail de déploiement par lots. Vous pouvez configurer le travail de déploiement par lots en fournissant des détails sur les données d'entrée, le fichier de sortie et des informations sur l'exécution du travail selon un planning ou à la demande. Pour plus d'informations, voir Création de déploiements par lots dans Watson Machine Learning.
Déploiement d'application: Créez un déploiement d'application pour déployer vos actifs d'application, tels que les applications R Shiny. Pour plus d'informations, voir Déploiement d'applications Shiny dans Watson Machine Learning.
Extraction des noeuds finaux de déploiement
Pour utiliser votre ressource déployée dans des applications permettant de faire des prédictions, récupérez l'URL du point de terminaison de votre déploiement en ligne ou par lots. Le noeud final de modèle permet d'accéder à une interface pour appeler et gérer les déploiements de modèle.
Pour plus d'informations, voir Extraction du noeud final pour un déploiement en ligne ou Extraction du noeud final pour un déploiement par lots.
Types d'actifs déployables
Vous pouvez utiliser certains actifs uniquement pour créer des déploiements en ligne ou par lots. Par exemple, les déploiements en ligne et par lots prennent en charge le déploiement d'actifs tels que des fonctions, des scripts et des modèles Python , tels que des modèles AutoAI ou Decision Optimization . Toutefois, vous pouvez créer des déploiements en ligne uniquement pour les modèles importés à partir d'un fichier. Les différents types d'actifs déployables sont les suivants:
- Actifs de modèle de base: Vous pouvez déployer des actifs de modèle de base, tels que des actifs de modèle de base optimisés ou des actifs de modèle d'invite avec watsonx.ai. Pour plus d'informations, voir Déploiement d'actifs de modèle de base.
- Machine Learning : Vous pouvez déployer des actifs d'apprentissage automatique Machine Learning tels que des fonctions Python , des applications R Shiny, des modèles NLP, des scripts, etc. avec Watson Machine Learning. Pour plus d'informations, voir Déploiement d'actifs Machine Learning.
- ModèlesDecision Optimization : vous pouvez déployer le modèle Decision Optimization avec Watson Machine Learning.
Gestion des déploiements
Vous pouvez accéder, mettre à jour, mettre à l'échelle, supprimer et surveiller les performances de votre déploiement dans votre espace de déploiement:
- Accès à un déploiement: Vous pouvez accéder aux détails liés à votre déploiement, tels que le type d'étape, qui indique si l'espace de déploiement est destiné à des fins de préproduction ou de production.
- Mise à jour d'un déploiement: Vous pouvez mettre à jour les détails de votre déploiement, tels que le nom du déploiement, la spécification logicielle, etc. Pour plus d'informations, voir Mise à jour d'un déploiement.
- Mise à l'échelle d'un déploiement: Vous pouvez créer plusieurs copies de votre déploiement afin d'augmenter l'évolutivité et la disponibilité pour un volume plus important de demandes d'évaluation. Pour plus d'informations, voir Mise à l'échelle d'un déploiement.
- Suppression d'un déploiement: Supprimez votre déploiement lorsque vous n'en avez plus besoin pour libérer des ressources. Pour plus d'informations, voir Suppression d'un déploiement.
- Surveiller les performances de déploiement: Vous pouvez évaluer vos déploiements pour mesurer les performances et comprendre les prévisions de modèle en mettant à disposition une instance Watson OpenScale et en configurant des moniteurs d'équité, de qualité, de dérive et d'explicabilité.
Surveillance de l'activité de déploiement
Utilisez le tableau de bord des déploiements pour obtenir une vue agrégée de vos déploiements et surveiller l'activité de déploiement. Vous pouvez utiliser le tableau de bord pour surveiller le statut de vos travaux de déploiement par lots, tels que les exécutions actives et les exécutions terminées en fonction de la planification de travail que vous avez définie lors de la création du travail. Vous pouvez également obtenir des informations sur le nombre de déploiements en ligne ayant abouti ou échoué. Pour plus d'informations, voir Deployments dashboard.
Gestion des environnements d'exécution pour les déploiements
Les environnements d'exécution fournissent les fonctions nécessaires à l'exécution de votre déploiement.
Vous pouvez utiliser des environnements d'exécution prédéfinis ou créer des environnements d'exécution personnalisés pour inclure d'autres composants, en fonction de votre cas d'utilisation. Pour créer un environnement d'exécution personnalisé pour votre déploiement, vous devez créer un fichier Dockerfile et ajouter une image de base. En outre, vous pouvez ajouter les commandes docker
pour générer l'environnement d'exécution de votre déploiement. Pour plus d'informations, voir Personnalisation des environnements d'exécution de déploiement Watson Machine Learning.
Gestion des infrastructures et des spécifications logicielles pour les déploiements
Les spécifications et les infrastructures logicielles contiennent des bundles de packages avec les versions correspondantes des packages.
Vous pouvez utiliser des spécifications logicielles prédéfinies ou créer des spécifications logicielles personnalisées, en fonction de votre cas d'utilisation. Par exemple, vous pouvez ajouter de nouveaux packages à des infrastructures existantes, créer de nouveaux packages ou remplacer des versions de package à partir des spécifications logicielles.
Vous devez mettre à jour les spécifications logicielles de votre modèle vers la version la plus récente après l'obsolescence pour garantir un service continu. Lorsqu'une infrastructure est obsolète, la prise en charge de cette infrastructure est supprimée dans une édition ultérieure.
Pour plus d'informations, voir Structures et spécifications logicielles dans Watson Machine Learning.
En savoir plus
Rubrique parent: Déploiement et gestion d'actifs d'IA