Sauvegarde des invites

Dernière mise à jour : 20 mars 2025

L'ingénierie rapide implique des essais et des erreurs. Gardez une trace de vos expérimentations et sauvegardez les combinaisons de modèle et d'invite qui génèrent la sortie souhaitée.

Lorsque vous sauvegardez votre travail, vous pouvez choisir de l'enregistrer en tant que différents types d'actif. La sauvegarde de votre travail en tant qu'actif permet de partager votre travail avec des collaborateurs dans le projet en cours.

Tableau 1 : Types d'actifs utilisés pour enregistrer les invites
Type d'actif	Quand utiliser ce type d'actif	Ce qui est sauvegardé	Comment extraire l'actif
Actif de modèle d'invite	Lorsque vous trouvez une combinaison de texte statique d'invite, de variables d'invite et de paramètres d'ingénierie d'invite qui génèrent les résultats souhaités à partir d'un modèle spécifique et que vous souhaitez les réutiliser.	Texte de l'invite, modèle, paramètres techniques de l'invite, variables de l'invite et paramètres des garde-fous AI. Remarque: La sortie générée par le modèle n'est pas enregistrée dans le cadre du modèle d'invite sauf si l'invite a été créée en mode de discussion.	Dans l'onglet Modèles d'invite enregistrés
Actif de session d'invite	Lorsque vous voulez suivre les étapes de votre expérimentation afin de savoir ce que vous avez essayé et ce que vous n'avez pas.	Texte de l'invite, modèle, paramètres d'ingénierie de l'invite, paramètres des garde-fous AI et sortie du modèle pour un maximum de 500 invites soumises lors d'une session d'ingénierie de l'invite.	Dans l'onglet Historique
Matériel d'ordinateur portable standard	Lorsque vous souhaitez travailler avec des modèles de manière programmatique, mais que vous voulez commencer à partir de l'interface Prompt Lab pour une meilleure expérience de l'ingénierie d'invite.	Le texte de l'invite, le modèle, les paramètres d'ingénierie de l'invite, les noms des variables de l'invite et les valeurs par défaut sont formatés sous forme de code Python et stockés dans un carnet Python.	A partir de la page Actifs du projet
Notebook de déploiement	Lorsque votre assistant peut exécuter des fonctions avancées, telles que la recherche de documents de base pour répondre à des questions posées lors d'un chat, et que vous souhaitez déployer cette fonction en tant que service d'IA.	Un service d'IA déployable qui peut être consommé par des API REST. Note : Vous ne pouvez enregistrer votre travail en tant que cahier de déploiement que si vous sélectionnez un index vectoriel et utilisez un modèle de chat.	A partir de la page Actifs du projet

Chacun de ces types d'actif est disponible sur la page Actifs du projet. Les collaborateurs du projet ayant le rôle d' administrateur ou d' éditeur peuvent ouvrir et utiliser les ressources. Les ressources de votre modèle d'invite et de votre session d'invite sont verrouillées automatiquement, mais vous pouvez les déverrouiller en cliquant sur l'icône Verrouiller Icône de verrouillage .

Les éditeurs et les administrateurs peuvent utiliser des actifs de modèle d'invite verrouillés pour générer des inférences. Seul le propriétaire du verrou peut utiliser un actif de session d'invite verrouillée pour générer des inférences.

Sauvegarde de vos travaux d'ingénierie rapide

Pour sauvegarder votre travail d'ingénierie d'invite, procédez comme suit:

Dans l'en-tête de l'éditeur d'invites, cliquez sur l'icône Enregistrer le travail , puis sur Enregistrer sous.
Choisissez un type d'actif.

Si vous choisissez de créer un carnet de notes Gen AI déployable, vous devez associer l'invite à un espace de déploiement. Pour plus d'informations, reportez-vous à la page relative aux espaces de déploiement.

Vous pouvez consulter les 100 premiers espaces de déploiement.
Nommez l'actif, puis ajoutez éventuellement une description.
Cliquez sur Sauvegarder.

Utilisation des invites enregistrées dans un bloc-notes

Lorsque vous sauvegardez votre travail en tant qu'actif de bloc-notes, un bloc-notes Python est généré.

Pour travailler avec un actif d'ordinateur portable, suivez la procédure correspondant à votre type d'ordinateur portable.

Notebook standard

Ouvrez l'actif de bloc-notes à partir de l'onglet Actifs de votre projet.
Cliquez sur l'icône Editer pour instancier le carnet de notes afin de pouvoir parcourir le code.

Le bloc-notes contient du code exécutable qui gère les étapes suivantes pour vous:
- S'authentifie auprès du service.
- Définit une classe Python .
- Définit le texte d'entrée du modèle et déclare toutes les variables d'invite. Vous pouvez éditer le texte d'invite statique et affecter des valeurs aux variables d'invite.
- Utilise la classe définie pour appeler l'API d'inférence watsonx.ai et transmettre vos données au modèle de base.
- Affiche la sortie générée par le modèle de fondation.
Note: Pour les invites qui accordent une inférence aux modèles stockés dans le projet, remplacez l'ID de l'espace par l'ID du projet.
Utilisez le bloc-notes tel qu'il est ou modifiez-le pour répondre aux besoins de votre cas d'utilisation.

Le code Python généré à l'aide du Prompt Lab s'exécute correctement. Vous devez tester et valider les modifications que vous apportez au code.

Notebook de déploiement

Ouvrez l'actif de bloc-notes à partir de l'onglet Actifs de votre projet.
Cliquez sur l'icône Editer pour instancier le carnet de notes afin de pouvoir parcourir le code.

Le bloc-notes contient du code exécutable qui gère les étapes suivantes pour vous:
- S'authentifie auprès du service.
- Se connecte à l'espace cible et favorise l'index vectoriel.
- Définit le service d'IA à déployer. Cela inclut le code permettant d'initialiser l'index vectoriel, d'effectuer des requêtes sur l'index vectoriel, de formater l'entrée du modèle et d'exécuter des inférences.
- Teste le service AI localement.
- Déploie le service d'IA dans l'espace cible.
- Teste le service d'intelligence artificielle déployé.
Utilisez le bloc-notes tel qu'il est ou modifiez-le pour répondre aux besoins de votre cas d'utilisation.

Le code Python généré à l'aide du Prompt Lab s'exécute correctement. Vous devez tester et valider les modifications que vous apportez au code.

Le service d'IA déployé par le bloc-notes peut être consommé à l'aide d'une API REST. Voici un exemple de demande cURL pour appeler votre déploiement :

curl --location '${PUBLIC_ENDPOINT}' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer ${IAM_TOKEN}' \
--data '{ \
  "input_data": [{
      "fields": ["Search", "Access token"],
      "values": [
        [${MESSAGES}],
        [${IAM_TOKEN}]]
    }]
}'

où

PUBLIC_ENDPOINT est le point de terminaison public de votre déploiement. Voir Création de déploiements en ligne .
IAM_TOKEN est le jeton d'authentification pour accéderIBM Cloud prestations de service. Voir Informations d'identification pour l'accès par programmation . Le jeton d'accès que vous utilisez doit être associé au même compte que le projet référencé dans le carnet.
MESSAGES est un tableau d'entrées de texte de l'historique des discussions avec le schéma suivant :

{
   "role": type, // "user" or "assistant"
   "content": content // The text content of the message
}

Pour plus d'informations sur le déploiement et l'inférence des services d'IA, voir Déployer des services d'IA avec des outils.

Utilisation des modèles d'invite enregistrés

Pour continuer à travailler avec une invite enregistrée, ouvrez-la à partir de l'onglet Modèles d'invite enregistrés du Prompt Lab.

Lorsque vous ouvrez un modèle d'invite sauvegardé, Enregistrement automatique est actif, ce qui signifie que toutes les modifications que vous apportez à l'invite seront reflétées dans l'actif de modèle d'invite sauvegardé. Si vous souhaitez que le modèle d'invite que vous avez sauvegardé reste inchangé, cliquez sur Nouvelle invite pour lancer une nouvelle invite.

Vous ne pouvez pas modifier les modes d'édition à partir d'un modèle d'invite sauvegardé.

Contrairement à d'autres modes d'édition, un modèle d'invite enregistré en mode de discussion stocke également la sortie du modèle. Vous ne pouvez pas passer à un autre mode à partir d'un modèle d'invite qui a été sauvegardé en mode de discussion. Les invites que vous enregistrez en tant que modèles d'invite peuvent inclure des documents de base d'une taille totale maximale de 5 Mo.

Lorsque watsonx.governance est mis à disposition, si votre modèle d'invite inclut au moins une variable d'invite, vous pouvez évaluer l'efficacité des réponses du modèle.

Pour plus d'informations sur les variables d'invite, voir Génération d'invites réutilisables.
Pour plus d'informations sur l'évaluation des réponses de modèle, voir Evaluation des modèles d'invite dans les projets.

Note : Vous ne pouvez pas déployer ou évaluer des modèles d'invite enregistrés qui déploient des modèles de fondation à la demande.

Utilisation des sessions d'invite enregistrées

Pour continuer à travailler avec une session d'invite sauvegardée, ouvrez-la à partir de l'onglet Historique de Prompt Lab

Pour passer en revue les soumissions d'invite précédentes, vous pouvez cliquer sur une entrée d'invite dans l'historique pour l'ouvrir dans l'éditeur d'invite. Si vous préférez les résultats de l'invite précédente, vous pouvez la réinitialiser en tant qu'invite en cours en cliquant sur Restaurer. Lorsque vous restaurez une invite antérieure, votre session d'invite en cours est remplacée par la version antérieure de la session d'invite.

En savoir plus

Sécurité et confidentialité des modèles de base

Sujet parent : Prompt Lab

La rubrique a-t-elle été utile ?

0/1000

Sauvegarde de vos travaux d'ingénierie rapideCopy link to section

Utilisation des invites enregistrées dans un bloc-notesCopy link to section

Notebook standardCopy link to section

Notebook de déploiementCopy link to section

Utilisation des modèles d'invite enregistrésCopy link to section

Utilisation des sessions d'invite enregistréesCopy link to section

En savoir plusCopy link to section