Déployez un modèle d'invite pour pouvoir l'ajouter à un flux de travaux métier ou pour pouvoir évaluer le modèle d'invite afin de mesurer les performances.
Promouvoir un modèle d'invite dans un espace de déploiement
Pour promouvoir un modèle d'invite vers un espace de déploiement, votre modèle d'invite doit contenir au moins une variable.
Vous ne pouvez pas promouvoir des modèles d'invite qui ne contiennent pas de variables dans votre espace de déploiement.
Pour déployer des modèles d'invite sans variables, vous devez exporter le projet qui contient la ressource de modèle d'invite et importer le projet dans votre espace de déploiement. Pour plus d'informations, voir Importer un modèle d'invite dans un espace de déploiement.
Notez ces considérations supplémentaires pour le déploiement d'un modèle d'invite :
- Vous ne pouvez créer des déploiements de modèles d'invite faisant référence à des déploiements de modèles que dans le même projet ou espace que celui où vous avez créé le déploiement de modèles. Si vous promouvez un modèle qui fait référence à un modèle déployé dans un espace, une copie de la ressource de modèle est automatiquement ajoutée à l'espace. Vous devez déployer le modèle dans l'espace avant de déployer le modèle d'invite.
- Si vous exportez un modèle d'invite qui fait référence à un modèle déployé, la ressource modèle associée est automatiquement exportée avec le modèle d'invite. Lorsque vous importez le modèle dans un nouveau conteneur, le modèle est également importé. Le modèle doit être déployé dans le nouveau conteneur avant de déployer le modèle d'invite.
Avant de commencer
Sauvegardez un modèle d'invite contenant au moins une variable en tant qu'actif de projet. Voir Génération d'invites réutilisables.
Vous devez définir les informations d'identification de votre tâche en générant une clé API. Pour plus d'informations, voir Gestion des informations d'identification des tâches.
Procédure
Pour déployer un modèle d'invite, procédez comme suit:
- Ouvrez le projet contenant le modèle d'invite.
- Cliquez sur Promouvoir dans l'espace pour le modèle.
Dans la zone Espace de déploiement cible , choisissez un espace de déploiement ou créez un nouvel espace. Notez ce qui suit :
L'espace de déploiement doit être associé à une instance d'apprentissage automatique qui se trouve dans le même compte que le projet dans lequel le modèle d'invite a été créé.
Si vous ne disposez pas d'un espace de déploiement, choisissez Créer un nouvel espace de déploiement, puis suivez les étapes de la rubrique Création d'espaces de déploiement.
Si vous prévoyez d'évaluer le modèle d'invite dans l'espace, le type d' étape de déploiement recommandé pour l'espace est Production. Pour plus d'informations sur l'évaluation, voir Evaluation d'un modèle d'invite dans un espace de déploiement.
Remarque: l'étape d'espace de déploiement ne peut pas être modifiée une fois l'espace créé.Astuce: sélectionnez Afficher le déploiement dans l'espace de déploiement après la création. Sinon, vous devez prendre des mesures supplémentaires pour trouver votre actif déployé.
Dans l'onglet Actifs de l'espace de déploiement, cliquez sur Déployer. Vous créez un déploiement en ligne, ce qui signifie que vous pouvez envoyer des données au noeud final et recevoir une réponse en temps réel.
Facultatif: dans la zone Nom de service de déploiement , ajoutez un libellé unique pour le déploiement.
Le nom du service est utilisé dans l' URL du point de terminaison de l'API qui identifie votre déploiement. L'ajout d'un nom est utile car le nom lisible que vous ajoutez remplace un ID unique long généré par le système qui est affecté autrement.
Le nom de service extrait également le déploiement des détails de son instance de service. Les applications font référence à ce nom, ce qui permet de modifier l'instance de service sous-jacente sans affecter les utilisateurs.
Le nom peut comporter jusqu'à 36 caractères. Les caractères pris en charge sont [a-z,0-9, _ ].
Le nom doit être unique dans la région IBM Cloud . Vous pouvez être invité à modifier le nom de service si le nom que vous choisissez est déjà utilisé.
Importation d'un modèle d'invite dans un espace de déploiement
Pour déployer des modèles d'invite sans variables, vous devez exporter le projet qui contient la ressource de modèle d'invite et importer le projet dans votre espace de déploiement.
Avant de commencer
Exportez votre projet contenant la ressource de modèle d'invite sous la forme d'un fichier ZIP.
Procédure
Pour importer une ressource de modèle d'invite dans un espace de déploiement, procédez comme suit :
Dans la barre d'outils de votre espace de déploiement, sélectionnez le menu déroulant " Espace export/import "
et cliquez sur " Espace d'importation.
Téléchargez le fichier ZIP qui contient votre ressource de modèle d'invite exportée de votre projet et cliquez sur Done.
Test du modèle d'invite déployé
Une fois le déploiement terminé, cliquez sur le nom du déploiement pour afficher le déploiement.
- L'onglet Référence d'API inclut les noeuds finaux d'API et les fragments de code dont vous avez besoin pour ajouter ce modèle d'invite à une application.
- L'onglet Test prend en charge le test du modèle d'invite. Entrez des données de test sous forme de texte, de texte en continu ou dans un fichier JSON.
Si le service watsonx.governance est activé, les onglets suivants s'affichent:
- Evaluer fournit les outils permettant d'évaluer le modèle d'invite dans l'espace. Cliquez sur Activer pour choisir les dimensions à évaluer. Pour plus de détails, voir Evaluation des modèles d'invite.
- AI Factsheets affiche toutes les métadonnées qui sont collectées pour le modèle d'invite. Utilisez ces détails pour le suivi du modèle d'invite pour les objectifs de gouvernance et de conformité. Voir Suivi des modèles d'invite.
Déploiement programmatique d'un modèle d'invite
Lorsque vous déployez un modèle d'invite par programme, vous devez suivre les étapes suivantes :
- Déplacer le poste de modèle et le modèle d'invite vers un espace de déploiement. Par exemple, si vous utilisez l' API watsonx.ai, récupérez le modèle et analysez l'adresse
model_id
stockée dansprompt.model_id
. Si vous utilisez Data and AI Common Core API, utilisezentity.wx_prompt.prompt.model_id
. L'ID est une chaîne de clés divisée par:
. Le dernier élément de la chaîne est la clé de ressource du modèle, qui renvoie à la ressource de modèle associée au modèle. - Déployer le modèle, en utilisant la clé de ressource du modèle de la première étape pour localiser le modèle à déployer pour le modèle. Par exemple, si vous utilisez l'API du tronc commun de données et d'intelligence artificielle, la requête recherche l'ID de l'espace ou du projet (
XXX
), le jeton de l'utilisateur (YYY
) et la clé de ressource du modèle associée au modèle d'invite (ZZZ
).
curl --location 'https://api.dataplatform.cloud.ibm.com/v2/asset_types/wml_model/search?space_id=XXX' \
--header 'Authorization: Bearer YYY' \
--header 'Content-Type: application/json' \
--data '{
"query": "(asset.resource_key:ZZZ)",
"include": "entity",
"limit": 100
}'
- Une fois le modèle déployé avec succès, déployez le modèle d'invite
En savoir plus
Evaluation d'un modèle d'invite dans un espace de déploiement
Suivez le tutoriel Démarrage rapide: Evaluer et suivre un modèle d'invite pour évaluer et suivre un exemple de modèle d'invite
Voir l'article de blogue IBM watsonx.governance pour la gestion et l'assurance des performances des modèles d'intelligence artificielle-Une approche prescriptive pour obtenir des conseils sur la façon d'opérationnaliser les applications métier et les flux de travaux avec l'inférence d'intelligence artificielle à l'aide du modèle d'invite déployé dans un bloc-notes
Rubrique parent: Déploiement et gestion des actifs