0 / 0
Retourner à la version anglaise de la documentation
enregistrement de votre travail
Dernière mise à jour : 12 déc. 2024
enregistrement de votre travail

L'ingénierie rapide implique des essais et des erreurs. Gardez une trace de vos expérimentations et sauvegardez les combinaisons de modèle et d'invite qui génèrent la sortie souhaitée.

Lorsque vous sauvegardez votre travail, vous pouvez choisir de l'enregistrer en tant que différents types d'actif. La sauvegarde de votre travail en tant qu'actif permet de partager votre travail avec des collaborateurs dans le projet en cours.

Tableau 1: Types d'actif
Type d'actif Quand utiliser ce type d'actif Ce qui est sauvegardé Comment extraire l'actif
Actif de modèle d'invite Lorsque vous trouvez une combinaison de texte statique d'invite, de variables d'invite et de paramètres d'ingénierie d'invite qui génèrent les résultats souhaités à partir d'un modèle spécifique et que vous souhaitez les réutiliser. Texte de l'invite, modèle, paramètres techniques de l'invite, variables de l'invite et paramètres des garde-fous AI.
Remarque: La sortie générée par le modèle n'est pas enregistrée dans le cadre du modèle d'invite sauf si l'invite a été créée en mode de discussion.
Dans l'onglet Modèles d'invite enregistrés
Actif de session d'invite Lorsque vous voulez suivre les étapes de votre expérimentation afin de savoir ce que vous avez essayé et ce que vous n'avez pas. Texte de l'invite, modèle, paramètres d'ingénierie de l'invite, paramètres des garde-fous AI et sortie du modèle pour un maximum de 500 invites soumises lors d'une session d'ingénierie de l'invite. Dans l'onglet Historique
Matériel d'ordinateur portable standard Lorsque vous souhaitez travailler avec des modèles de manière programmatique, mais que vous voulez commencer à partir de l'interface Prompt Lab pour une meilleure expérience de l'ingénierie d'invite. Le texte de l'invite, le modèle, les paramètres d'ingénierie de l'invite, les noms des variables de l'invite et les valeurs par défaut sont formatés sous forme de code Python et stockés dans un carnet Python. A partir de la page Actifs du projet
Notebook de déploiement Lorsque votre assistant peut exécuter des fonctions avancées, telles que la recherche de documents de base pour répondre à des questions posées lors d'un chat, et que vous souhaitez déployer cette fonction en tant que service d'IA. Une fonction Python déployable qui peut être consommée par des API REST.
Note : Vous ne pouvez enregistrer votre travail en tant que cahier de déploiement que si vous sélectionnez un index vectoriel et utilisez un modèle de chat.
A partir de la page Actifs du projet

Chacun de ces types d'actif est disponible sur la page Actifs du projet. Les collaborateurs de projet dotés du rôle Administrateur ou Editeur peuvent les ouvrir et les utiliser. Les ressources de votre modèle d'invite et de votre session d'invite sont verrouillées automatiquement, mais vous pouvez les déverrouiller en cliquant sur l'icône Verrouiller Icône de verrouillage.

Les éditeurs et les administrateurs peuvent utiliser des actifs de modèle d'invite verrouillés pour générer des inférences. Seul le propriétaire du verrou peut utiliser un actif de session d'invite verrouillée pour générer des inférences.

enregistrement de votre travail

Pour sauvegarder votre travail d'ingénierie d'invite, procédez comme suit:

  1. Dans l'en-tête de l'éditeur d'invites, cliquez sur l'icône Enregistrer le travail Icône Sauvegarder, puis sur Enregistrer sous.

  2. Choisissez un type d'actif.

    Si vous choisissez de créer un carnet de notes Gen AI déployable, vous devez associer l'invite à un espace de déploiement. Pour plus d'informations, reportez-vous à la page relative aux espaces de déploiement.

  3. Nommez l'actif, puis ajoutez éventuellement une description.

  4. Watsonx.governance uniquement: choisissez le type de tâche qui correspond le mieux à votre objectif.

  5. Si vous sauvegardez l'invite en tant qu'actif de bloc-notes uniquement: sélectionnez Afficher dans le projet après la sauvegarde.

  6. Cliquez sur Sauvegarder.

Utilisation des invites enregistrées dans un bloc-notes

Lorsque vous sauvegardez votre travail en tant qu'actif de bloc-notes, un bloc-notes Python est généré.

Pour utiliser une ressource de bloc-notes d'invite, procédez comme suit en fonction du type de bloc-notes :

Notebook standard

  1. Ouvrez l'actif de bloc-notes à partir de l'onglet Actifs de votre projet.

  2. Cliquez sur l'icône Editer Icône Editer pour instancier le carnet de notes afin de pouvoir parcourir le code.

    Le bloc-notes contient du code exécutable qui gère les étapes suivantes pour vous:

    • S'authentifie auprès du service.
    • Définit une classe Python .
    • Définit le texte d'entrée du modèle et déclare toutes les variables d'invite. Vous pouvez éditer le texte d'invite statique et affecter des valeurs aux variables d'invite.
    • Utilise la classe définie pour appeler l'API d'inférence watsonx.ai et transmettre vos données au foundation model.
    • Affiche la sortie générée par le foundation model.
    Note: Pour les invites qui accordent une inférence aux modèles stockés dans le projet, remplacez l'ID de l'espace par l'ID du projet.
  3. Utilisez le bloc-notes tel qu'il est ou modifiez-le pour répondre aux besoins de votre cas d'utilisation.

    Le code Python généré à l'aide du Prompt Lab s'exécute correctement. Vous devez tester et valider les modifications que vous apportez au code.

Notebook de déploiement

  1. Ouvrez l'actif de bloc-notes à partir de l'onglet Actifs de votre projet.

  2. Cliquez sur l'icône Editer Icône Editer pour instancier le carnet de notes afin de pouvoir parcourir le code.

    Le bloc-notes contient du code exécutable qui gère les étapes suivantes pour vous:

    • S'authentifie auprès du service.
    • Se connecte à l'espace cible et favorise l'index vectoriel.
    • Définit la fonction python à déployer. Cela inclut le code permettant d'initialiser l'index vectoriel, d'effectuer des requêtes sur l'index vectoriel, de formater l'entrée du modèle et d'exécuter des inférences.
    • Teste la fonction python localement.
    • Déploie la fonction python dans l'espace cible.
    • Teste la fonction python déployée.
  3. Utilisez le bloc-notes tel qu'il est ou modifiez-le pour répondre aux besoins de votre cas d'utilisation.

    Le code Python généré à l'aide du Prompt Lab s'exécute correctement. Vous devez tester et valider les modifications que vous apportez au code.

  4. LePython La fonction déployée par le notebook peut être utilisée à l'aide d'une API REST. Ce qui suit est un exemplecURL demande d'appel de votre déploiement :

    curl --location '${PUBLIC_ENDPOINT}' \
    --header 'Content-Type: application/json' \
    --header 'Authorization: Bearer ${IAM_TOKEN}' \
    --data '{ \
      "input_data": [{
          "fields": ["Search", "Access token"],
          "values": [
            [${MESSAGES}],
            [${IAM_TOKEN}]]
        }]
    }'
    

    {
       "role": type, // "user" or "assistant"
       "content": content // The text content of the message
    }
    

Utilisation des modèles d'invite enregistrés

Pour continuer à travailler avec une invite enregistrée, ouvrez-la à partir de l'onglet Modèles d'invite enregistrés du Prompt Lab.

Lorsque vous ouvrez un modèle d'invite sauvegardé, Enregistrement automatique est actif, ce qui signifie que toutes les modifications que vous apportez à l'invite seront reflétées dans l'actif de modèle d'invite sauvegardé. Si vous souhaitez que le modèle d'invite que vous avez sauvegardé reste inchangé, cliquez sur Nouvelle invite pour lancer une nouvelle invite.

Vous ne pouvez pas modifier les modes d'édition à partir d'un modèle d'invite sauvegardé.

Contrairement à d'autres modes d'édition, un modèle d'invite enregistré en mode de discussion stocke également la sortie du modèle. Vous ne pouvez pas passer à un autre mode à partir d'un modèle d'invite qui a été sauvegardé en mode de discussion.

Lorsque watsonx.governance est mis à disposition, si votre modèle d'invite inclut au moins une variable d'invite, vous pouvez évaluer l'efficacité des réponses du modèle.

Note : Vous ne pouvez pas déployer ou évaluer des modèles d'invite enregistrés qui déploient des modèles de fondation à la demande.

Utilisation des sessions d'invite enregistrées

Pour continuer à travailler avec une session d'invite sauvegardée, ouvrez-la à partir de l'onglet Historique de Prompt Lab

Pour passer en revue les soumissions d'invite précédentes, vous pouvez cliquer sur une entrée d'invite dans l'historique pour l'ouvrir dans l'éditeur d'invite. Si vous préférez les résultats de l'invite précédente, vous pouvez la réinitialiser en tant qu'invite en cours en cliquant sur Restaurer. Lorsque vous restaurez une invite antérieure, votre session d'invite en cours est remplacée par la version antérieure de la session d'invite.

En savoir plus

Sujet parent : Prompt Lab

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus