Déployer des modèles de fondation à la demande (voie rapide)
Déployer un modèle de base à la demande sur du matériel dédié en quelques étapes seulement. IBM watsonx.ai fournit un ensemble organisé de modèles de fond de teint populaires que vous pouvez déployer à la demande dans un espace de déploiement dédié à l'usage exclusif des utilisateurs ayant accès à cet espace. La méthode la plus rapide pour déployer un modèle de base à la demande consiste à sélectionner et déployer un modèle à partir du hub de ressources.
Avant de commencer
- Vous devez configurer ou activer vos identifiants de tâches pour déployer les modèles de fondation à la demande. Pour plus d'informations, voir Gestion des informations d'identification des tâches.
- Passez en revue les architectures de modèles de base prises en charge, les types de déploiement et d'autres considérations pour déployer un modèle de base à la demande. Pour plus d'informations, voir Déploiement de modèles de fondation à la demande.
Regardez cette vidéo pour découvrir comment déployer un modèle de fondation à la demande.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Déployer un modèle de base à la demande
Pour déployer un modèle de fondation à la demande à partir du hub de ressources, procédez comme suit :
Ouvrez le centre de ressources à partir du menu de navigation
.
Astuce :Choisissez le filer Déploiement à la demande pour afficher une liste de modèles que vous pouvez déployer à la demande.
Dans la section Payer à l'heure, recherchez le modèle que vous souhaitez déployer à la demande.
Dans la page de détails du modèle, cliquez sur Déployer.
Cliquez sur Déployer depuis la tuile du modèle de fondation, puis choisissez l'espace de déploiement où vous souhaitez déployer le modèle de fondation.
Important :Vous ne pouvez déployer qu'une seule instance d'un modèle de base à la demande dans un espace de déploiement. Si le modèle sélectionné est déjà déployé, le lien de déploiement existant sera disponible pour l'utilisateur dans la section Détails. Pour plus d'informations, voir Dépannage de l'environnement d'exécution d' watsonx.ai.
Cliquez sur Créer.
Une fois le modèle déployé, vous pouvez appeler le modèle de base à partir de l' Prompt Lab, ou de l'API watsonx.ai.
Test du déploiement
Suivez ces étapes pour tester un modèle de fondation déployé à la demande :
Dans votre espace de déploiement, ouvrez l'onglet Déploiements et cliquez sur le nom du déploiement.
Cliquez sur l'onglet Test pour saisir un texte d'invite et obtenir une réponse du poste déployé.
Saisissez les données de test dans l'un des formats suivants, en fonction du type de bien que vous avez déployé :
a. Texte: Saisir les données d'entrée du texte pour générer un bloc de texte en sortie.
B. Flux: Saisir les données d'entrée du texte pour générer un flux de texte en sortie.
c. JSON: Saisir des données d'entrée JSON pour générer une sortie au format JSON.Cliquez sur Générer pour obtenir des résultats basés sur votre demande.
Gérer le déploiement
Accédez à votre modèle de base déployé à la demande depuis le hub de ressources, mettez-le à jour, redimensionnez-le ou supprimez-le.
Accès au modèle déployé
Vous pouvez accéder au modèle de fondation déployé à la demande à partir du hub de ressources en utilisant le lien de déploiement.
Suivez ces étapes pour accéder au lien de déploiement à partir du concentrateur de ressources :
Dans le menu de navigation, accédez au centre de ressources.
Dans le catalogue de modèles de Foundation, dans le hub de ressources, sélectionnez le modèle que vous avez déployé.
Dans la section Détails de la page de détails du modèle, cliquez sur le lien Déploiement.
Vous pouvez également accéder aux détails de votre modèle de base déployé à la demande, tels que l'ID de déploiement, les spécifications du logiciel, les ressources associées, etc., à partir de la page des détails de déploiement.
Mise à jour du déploiement
Mettez à jour les informations requises pour votre modèle de fondation déployé à la demande, telles que le nom, la description, les balises, etc. Pour plus d'informations, voir Mise à jour d'une répartition.
Mise à l'échelle du déploiement
Vous ne pouvez déployer qu'une seule instance d'un modèle de base à la demande dans un espace de déploiement. Pour faire face à une demande accrue, vous pouvez faire évoluer le déploiement en créant des copies supplémentaires. Pour plus d'informations, voir Mise à l'échelle d'un déploiement.
Suppression du déploiement
Lorsque votre travail avec le modèle de base déployé à la demande est terminé, supprimez le déploiement pour arrêter les frais de facturation. Pour plus d'informations, voir Suppression d'une répartition.
En savoir plus
- Modèles de fondations soutenus
- Prompt Lab
- Déployer des modèles de fondation à la demande en utilisant l'API REST
- Taux de facturation horaire pour les modèles de déploiement à la demande
Sujet parent : Déployer des modèles de fondation à la demande