Déployez un foundation model à la demande sur du matériel dédié en quelques étapes seulement. IBM watsonx.ai fournit un ensemble de modèles de base populaires que vous pouvez déployer à la demande dans un espace de déploiement dédié à l'usage exclusif des utilisateurs ayant accès à cet espace. La méthode la plus rapide pour déployer un foundation model à la demande consiste à sélectionner et à déployer un modèle à partir du centre de ressources.
Avant de commencer
- Vous devez configurer ou activer vos identifiants de tâches pour déployer les modèles de fondation à la demande. Pour plus d'informations, voir Gestion des informations d'identification des tâches.
- Examiner les architectures de foundation model prises en charge, les types de déploiement et d'autres considérations relatives au déploiement d'un foundation model à la demande. Pour plus d'informations, voir Déploiement de modèles de fondation à la demande.
Regardez cette vidéo pour savoir comment déployer un foundation model à la demande.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Déployer un foundation model à la demande
Pour déployer un foundation model à la demande à partir du centre de ressources, effectuez les étapes suivantes :
Ouvrez le centre de ressources à partir du menu de navigation "
.
Astuce :Choisissez le filer Déploiement à la demande pour afficher une liste de modèles que vous pouvez déployer à la demande.
Dans la section Payer à l'heure, recherchez le modèle que vous souhaitez déployer à la demande.
Dans la page de détails du modèle, cliquez sur Déployer.
Cliquez sur Déployer dans la tuile du foundation model, puis choisissez l'espace de déploiement dans lequel vous souhaitez déployer le foundation model.
Important :Vous ne pouvez déployer qu'une seule instance d'un foundation model à la demande dans un espace de déploiement. Si le modèle sélectionné est déjà déployé, le lien de déploiement existant sera disponible pour l'utilisateur dans la section Détails. Pour plus d'informations, voir Dépannage du moteur d'exécution watsonx.ai
Cliquez sur Créer.
Une fois le modèle déployé, vous pouvez demander l'exécution du foundation model à partir de Prompt Lab ou de l'API watsonx.ai
Test du déploiement
Suivez les étapes suivantes pour tester un foundation model déployé à la demande :
Dans votre espace de déploiement, ouvrez l'onglet Déploiements et cliquez sur le nom du déploiement.
Cliquez sur l'onglet Test pour saisir un texte d'invite et obtenir une réponse du poste déployé.
Saisissez les données de test dans l'un des formats suivants, en fonction du type de bien que vous avez déployé :
a. Texte: Saisir les données d'entrée du texte pour générer un bloc de texte en sortie.
B. Flux: Saisir les données d'entrée du texte pour générer un flux de texte en sortie.
c. JSON: Saisir des données d'entrée JSON pour générer une sortie au format JSON.Cliquez sur Générer pour obtenir des résultats basés sur votre demande.
Gérer le déploiement
Accédez, mettez à jour, adaptez ou supprimez votre foundation model qui est déployé à la demande à partir du centre de ressources.
Accès au modèle déployé
Vous pouvez accéder au foundation model qui est déployé à la demande à partir du centre de ressources en utilisant le lien de déploiement.
Suivez ces étapes pour accéder au lien de déploiement à partir du concentrateur de ressources :
Dans le menu de navigation, accédez au centre de ressources.
Dans le catalogue de modèles de Foundation, dans le hub de ressources, sélectionnez le modèle que vous avez déployé.
Dans la section Détails de la page de détails du modèle, cliquez sur le lien Déploiement.
Vous pouvez également accéder aux détails de votre foundation model déployé à la demande, tels que l'identifiant de déploiement, la spécification logicielle, le bien associé, etc. à partir de la page des détails du déploiement.
Mise à jour du déploiement
Mettez à jour les détails requis pour votre foundation model qui est déployé à la demande, tels que le nom, la description, les balises, etc. Pour plus d'informations, voir Mise à jour d'une répartition.
Mise à l'échelle du déploiement
Vous ne pouvez déployer qu'une seule instance d'un foundation model à la demande dans un espace de déploiement. Pour faire face à une demande accrue, vous pouvez faire évoluer le déploiement en créant des copies supplémentaires. Pour plus d'informations, voir Mise à l'échelle d'un déploiement.
Suppression du déploiement
Lorsque votre travail avec le foundation model déployé à la demande est terminé, supprimez le déploiement pour arrêter les frais de facturation. Pour plus d'informations, voir Suppression d'une répartition.
En savoir plus
- Modèles de fondations soutenus
- Laboratoire d'invites
- Déployer des modèles de fondation à la demande en utilisant l'API REST
- Taux de facturation horaire pour les modèles de déploiement à la demande
Sujet parent : Déployer des modèles de fondation à la demande