0 / 0
Retourner à la version anglaise de la documentation
Déployer des modèles de fondation à la demande (voie rapide)
Dernière mise à jour : 05 déc. 2024
Déployer des modèles de fondation à la demande (voie rapide)

Déployez un foundation model à la demande sur du matériel dédié en quelques étapes seulement. IBM watsonx.ai fournit un ensemble de modèles de base populaires que vous pouvez déployer à la demande dans un espace de déploiement dédié à l'usage exclusif des utilisateurs ayant accès à cet espace. La méthode la plus rapide pour déployer un foundation model à la demande consiste à sélectionner et à déployer un modèle à partir du centre de ressources.

Avant de commencer

  1. Vous devez configurer ou activer vos identifiants de tâches pour déployer les modèles de fondation à la demande. Pour plus d'informations, voir Gestion des informations d'identification des tâches.
  2. Examiner les architectures de foundation model prises en charge, les types de déploiement et d'autres considérations relatives au déploiement d'un foundation model à la demande. Pour plus d'informations, voir Déploiement de modèles de fondation à la demande.

Regardez cette vidéo pour savoir comment déployer un foundation model à la demande.

Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.

Déployer un foundation model à la demande

Pour déployer un foundation model à la demande à partir du centre de ressources, effectuez les étapes suivantes :

  1. Ouvrez le centre de ressources à partir du menu de navigation " Icône du menu de navigation.

    Astuce :

    Choisissez le filer Déploiement à la demande pour afficher une liste de modèles que vous pouvez déployer à la demande.

  2. Dans la section Payer à l'heure, recherchez le modèle que vous souhaitez déployer à la demande.

    Capture d'écran montrant la liste des modèles de fondation disponibles pour le déploiement à la demande dans le centre de ressources

  3. Dans la page de détails du modèle, cliquez sur Déployer.

    Capture d'écran montrant la page des détails du modèle

  4. Cliquez sur Déployer dans la tuile du foundation model, puis choisissez l'espace de déploiement dans lequel vous souhaitez déployer le foundation model.

    La capture d'écran montre comment créer le déploiement

    Important :

    Vous ne pouvez déployer qu'une seule instance d'un foundation model à la demande dans un espace de déploiement. Si le modèle sélectionné est déjà déployé, le lien de déploiement existant sera disponible pour l'utilisateur dans la section Détails. Pour plus d'informations, voir Dépannage du moteur d'exécution watsonx.ai

  5. Cliquez sur Créer.

Une fois le modèle déployé, vous pouvez demander l'exécution du foundation model à partir de Prompt Lab ou de l'API watsonx.ai

Test du déploiement

Suivez les étapes suivantes pour tester un foundation model déployé à la demande :

  1. Dans votre espace de déploiement, ouvrez l'onglet Déploiements et cliquez sur le nom du déploiement.

  2. Cliquez sur l'onglet Test pour saisir un texte d'invite et obtenir une réponse du poste déployé.

  3. Saisissez les données de test dans l'un des formats suivants, en fonction du type de bien que vous avez déployé :

    a. Texte: Saisir les données d'entrée du texte pour générer un bloc de texte en sortie.
    B. Flux: Saisir les données d'entrée du texte pour générer un flux de texte en sortie.
    c. JSON: Saisir des données d'entrée JSON pour générer une sortie au format JSON.

    foundation model test déployé à la demande

  4. Cliquez sur Générer pour obtenir des résultats basés sur votre demande.

Gérer le déploiement

Accédez, mettez à jour, adaptez ou supprimez votre foundation model qui est déployé à la demande à partir du centre de ressources.

Accès au modèle déployé

Vous pouvez accéder au foundation model qui est déployé à la demande à partir du centre de ressources en utilisant le lien de déploiement.

Suivez ces étapes pour accéder au lien de déploiement à partir du concentrateur de ressources :

  1. Dans le menu de navigation, accédez au centre de ressources.

  2. Dans le catalogue de modèles de Foundation, dans le hub de ressources, sélectionnez le modèle que vous avez déployé.

  3. Dans la section Détails de la page de détails du modèle, cliquez sur le lien Déploiement.

    Accès au modèle déployé à la demande à partir du centre de ressources

Vous pouvez également accéder aux détails de votre foundation model déployé à la demande, tels que l'identifiant de déploiement, la spécification logicielle, le bien associé, etc. à partir de la page des détails du déploiement.

Accès au modèle de déploiement à la demande à partir de l'espace de déploiement

Mise à jour du déploiement

Mettez à jour les détails requis pour votre foundation model qui est déployé à la demande, tels que le nom, la description, les balises, etc. Pour plus d'informations, voir Mise à jour d'une répartition.

Restriction : Le remplacement du bien n'est pas pris en charge pour les modèles de fondation déployés à la demande.

Mise à jour du modèle de déploiement à la demande à partir de l'espace de déploiement

Mise à l'échelle du déploiement

Vous ne pouvez déployer qu'une seule instance d'un foundation model à la demande dans un espace de déploiement. Pour faire face à une demande accrue, vous pouvez faire évoluer le déploiement en créant des copies supplémentaires. Pour plus d'informations, voir Mise à l'échelle d'un déploiement.

Mise à jour du modèle de déploiement à la demande à partir de l'espace de déploiement

Suppression du déploiement

Lorsque votre travail avec le foundation model déployé à la demande est terminé, supprimez le déploiement pour arrêter les frais de facturation. Pour plus d'informations, voir Suppression d'une répartition.

En savoir plus

Sujet parent : Déployer des modèles de fondation à la demande