L'ingénierie rapide implique des essais et des erreurs. Gardez une trace de vos expérimentations et sauvegardez les combinaisons de modèle et d'invite qui génèrent la sortie souhaitée.
Lorsque vous sauvegardez votre travail, vous pouvez choisir de l'enregistrer en tant que différents types d'actif. La sauvegarde de votre travail en tant qu'actif permet de partager votre travail avec des collaborateurs dans le projet en cours.
Type d'actif | Quand utiliser ce type d'actif | Ce qui est sauvegardé | Comment extraire l'actif |
---|---|---|---|
Actif de modèle d'invite | Lorsque vous trouvez une combinaison de texte statique d'invite, de variables d'invite et de paramètres d'ingénierie d'invite qui génèrent les résultats souhaités à partir d'un modèle spécifique et que vous souhaitez les réutiliser. | Texte de l'invite, modèle, paramètres techniques de l'invite, variables de l'invite et paramètres des garde-fous AI. Remarque: La sortie générée par le modèle n'est pas enregistrée dans le cadre du modèle d'invite sauf si l'invite a été créée en mode de discussion.
|
Dans l'onglet Modèles d'invite enregistrés |
Actif de session d'invite | Lorsque vous voulez suivre les étapes de votre expérimentation afin de savoir ce que vous avez essayé et ce que vous n'avez pas. | Texte de l'invite, modèle, paramètres d'ingénierie de l'invite, paramètres des garde-fous AI et sortie du modèle pour un maximum de 500 invites soumises lors d'une session d'ingénierie de l'invite. | Dans l'onglet Historique |
Matériel d'ordinateur portable standard | Lorsque vous souhaitez travailler avec des modèles de manière programmatique, mais que vous voulez commencer à partir de l'interface Prompt Lab pour une meilleure expérience de l'ingénierie d'invite. | Le texte de l'invite, le modèle, les paramètres d'ingénierie de l'invite, les noms des variables de l'invite et les valeurs par défaut sont formatés sous forme de code Python et stockés dans un carnet Python. | A partir de la page Actifs du projet |
Notebook de déploiement | Lorsque votre assistant peut exécuter des fonctions avancées, telles que la recherche de documents de base pour répondre à des questions posées lors d'un chat, et que vous souhaitez déployer cette fonction en tant que service d'IA. | Une fonction Python déployable qui peut être consommée par des API REST. Note : Vous ne pouvez enregistrer votre travail en tant que cahier de déploiement que si vous sélectionnez un index vectoriel et utilisez un modèle de chat.
|
A partir de la page Actifs du projet |
Chacun de ces types d'actif est disponible sur la page Actifs du projet. Les collaborateurs de projet dotés du rôle Administrateur ou Editeur peuvent les ouvrir et les utiliser. Les ressources de votre modèle d'invite et de votre session d'invite sont verrouillées automatiquement, mais vous pouvez les déverrouiller en cliquant sur l'icône Verrouiller .
Les éditeurs et les administrateurs peuvent utiliser des actifs de modèle d'invite verrouillés pour générer des inférences. Seul le propriétaire du verrou peut utiliser un actif de session d'invite verrouillée pour générer des inférences.
enregistrement de votre travail
Pour sauvegarder votre travail d'ingénierie d'invite, procédez comme suit:
Dans l'en-tête de l'éditeur d'invites, cliquez sur l'icône Enregistrer le travail , puis sur Enregistrer sous.
Choisissez un type d'actif.
Si vous choisissez de créer un carnet de notes Gen AI déployable, vous devez associer l'invite à un espace de déploiement. Pour plus d'informations, reportez-vous à la page relative aux espaces de déploiement.
Nommez l'actif, puis ajoutez éventuellement une description.
Watsonx.governance uniquement: choisissez le type de tâche qui correspond le mieux à votre objectif.
Si vous sauvegardez l'invite en tant qu'actif de bloc-notes uniquement: sélectionnez Afficher dans le projet après la sauvegarde.
Cliquez sur Sauvegarder.
Utilisation des invites enregistrées dans un bloc-notes
Lorsque vous sauvegardez votre travail en tant qu'actif de bloc-notes, un bloc-notes Python est généré.
Pour utiliser une ressource de bloc-notes d'invite, procédez comme suit en fonction du type de bloc-notes :
Notebook standard
Ouvrez l'actif de bloc-notes à partir de l'onglet Actifs de votre projet.
Cliquez sur l'icône Editer pour instancier le carnet de notes afin de pouvoir parcourir le code.
Le bloc-notes contient du code exécutable qui gère les étapes suivantes pour vous:
- S'authentifie auprès du service.
- Définit une classe Python .
- Définit le texte d'entrée du modèle et déclare toutes les variables d'invite. Vous pouvez éditer le texte d'invite statique et affecter des valeurs aux variables d'invite.
- Utilise la classe définie pour appeler l'API d'inférence watsonx.ai et transmettre vos données au foundation model.
- Affiche la sortie générée par le foundation model.
Note: Pour les invites qui accordent une inférence aux modèles stockés dans le projet, remplacez l'ID de l'espace par l'ID du projet.Utilisez le bloc-notes tel qu'il est ou modifiez-le pour répondre aux besoins de votre cas d'utilisation.
Le code Python généré à l'aide du Prompt Lab s'exécute correctement. Vous devez tester et valider les modifications que vous apportez au code.
Notebook de déploiement
Ouvrez l'actif de bloc-notes à partir de l'onglet Actifs de votre projet.
Cliquez sur l'icône Editer pour instancier le carnet de notes afin de pouvoir parcourir le code.
Le bloc-notes contient du code exécutable qui gère les étapes suivantes pour vous:
- S'authentifie auprès du service.
- Se connecte à l'espace cible et favorise l'index vectoriel.
- Définit la fonction python à déployer. Cela inclut le code permettant d'initialiser l'index vectoriel, d'effectuer des requêtes sur l'index vectoriel, de formater l'entrée du modèle et d'exécuter des inférences.
- Teste la fonction python localement.
- Déploie la fonction python dans l'espace cible.
- Teste la fonction python déployée.
Utilisez le bloc-notes tel qu'il est ou modifiez-le pour répondre aux besoins de votre cas d'utilisation.
Le code Python généré à l'aide du Prompt Lab s'exécute correctement. Vous devez tester et valider les modifications que vous apportez au code.
LePython La fonction déployée par le notebook peut être utilisée à l'aide d'une API REST. Ce qui suit est un exemplecURL demande d'appel de votre déploiement :
curl --location '${PUBLIC_ENDPOINT}' \ --header 'Content-Type: application/json' \ --header 'Authorization: Bearer ${IAM_TOKEN}' \ --data '{ \ "input_data": [{ "fields": ["Search", "Access token"], "values": [ [${MESSAGES}], [${IAM_TOKEN}]] }] }'
où
- PUBLIC_ENDPOINT est le point de terminaison public de votre déploiement. Voir Création de déploiements en ligne .
- IAM_TOKEN est le jeton d'authentification pour accéderIBM Cloud prestations de service. Voir Informations d'identification pour l'accès par programmation .
- MESSAGES est un tableau d'entrées de texte de l'historique des discussions avec le schéma suivant :
{ "role": type, // "user" or "assistant" "content": content // The text content of the message }
Utilisation des modèles d'invite enregistrés
Pour continuer à travailler avec une invite enregistrée, ouvrez-la à partir de l'onglet Modèles d'invite enregistrés du Prompt Lab.
Lorsque vous ouvrez un modèle d'invite sauvegardé, Enregistrement automatique est actif, ce qui signifie que toutes les modifications que vous apportez à l'invite seront reflétées dans l'actif de modèle d'invite sauvegardé. Si vous souhaitez que le modèle d'invite que vous avez sauvegardé reste inchangé, cliquez sur Nouvelle invite pour lancer une nouvelle invite.
Vous ne pouvez pas modifier les modes d'édition à partir d'un modèle d'invite sauvegardé.
Contrairement à d'autres modes d'édition, un modèle d'invite enregistré en mode de discussion stocke également la sortie du modèle. Vous ne pouvez pas passer à un autre mode à partir d'un modèle d'invite qui a été sauvegardé en mode de discussion.
Lorsque watsonx.governance est mis à disposition, si votre modèle d'invite inclut au moins une variable d'invite, vous pouvez évaluer l'efficacité des réponses du modèle.
- Pour plus d'informations sur les variables d'invite, voir Génération d'invites réutilisables.
- Pour plus d'informations sur l'évaluation des réponses de modèle, voir Evaluation des modèles d'invite dans les projets.
Utilisation des sessions d'invite enregistrées
Pour continuer à travailler avec une session d'invite sauvegardée, ouvrez-la à partir de l'onglet Historique de Prompt Lab
Pour passer en revue les soumissions d'invite précédentes, vous pouvez cliquer sur une entrée d'invite dans l'historique pour l'ouvrir dans l'éditeur d'invite. Si vous préférez les résultats de l'invite précédente, vous pouvez la réinitialiser en tant qu'invite en cours en cliquant sur Restaurer. Lorsque vous restaurez une invite antérieure, votre session d'invite en cours est remplacée par la version antérieure de la session d'invite.
En savoir plus
Sujet parent : Prompt Lab