Tuning Studio

Dernière mise à jour : 04 mars 2025
Tuning Studio

Personnalisez un modèle de base avec l' Tuning Studio, afin de l'adapter à vos besoins.

Autorisations requises

Pour réaliser des expériences de réglage, vous devez avoir le rôle Admin ou Editor dans un projet.

Tuning Studio n'est pas disponible avec tous les plans ou dans tous les centres de données. Voir les plans d'exécution dewatsonx.ai et la disponibilité régionale pour les services et les fonctionnalités.

Titres de compétences requis

Références des tâches

Format des données

Tableau: JSON, JSONL

Remarque: Vous pouvez utiliser les mêmes données d'apprentissage avec une ou plusieurs expérimentations d'optimisation.
Taille des données
50 à 10 000 paires d'exemples d'entrée et de sortie. La taille de fichier maximale est de 200 Mo.

Tuning Studio n'est pas disponible avec tous les plans ou dans tous les centres de données. Les modèles de base disponibles pour le réglage dans l' Tuning Studio peuvent également différer selon le centre de données. Pour plus d'informations, consultez watsonx.ai Plans d'exécution et disponibilité régionale des services et fonctionnalités.

Avant de commencer

En règle générale, l' Tuning Studio s est disponible à partir d'un projet qui est créé automatiquement pour vous lorsque vous vous inscrivez sur watsonx.ai. Le projet s'appelle sandbox et vous pouvez l'utiliser pour commencer à tester et personnaliser les modèles de base.

Si vous n'avez pas de projet, créez-en un. Dans le menu principal, développez Projets, puis cliquez sur Tous les projets.

  1. Cliquez sur Nouveau projet.

  2. Nommez le projet, puis ajoutez éventuellement une description.

    Pour plus d'informations sur les options de projet, telles que la création de rapports ou la journalisation, voir Création d'un projet.

  3. Cliquez sur Créer.

Prendre des décisions sur les options de réglage suivantes :

  • Trouvez le modèle de fondation qui convient le mieux à votre cas d'utilisation. Voir Choisir un modèle de fondation à régler.
  • Créez un ensemble d'exemples de messages qui suivent le modèle qui génère les meilleurs résultats en fonction de votre travail d'ingénierie des messages. Voir Formats de données.

Accorder un modèle de fond de teint

Sur la page d'accueil d' watsonx.ai, choisissez votre projet, puis cliquez sur Nouvelle ressource > Ajuster un modèle de fondation avec des données étiquetées.

  1. Nommez l'expérience de réglage.

  2. Facultatif : ajoutez une description et des balises. Ajoutez une description pour vous rappeler et aider les collaborateurs à comprendre l'objectif du modèle ajusté. L'attribution d'une balise vous permet de filtrer ultérieurement vos ressources de réglage afin de n'afficher que les ressources associées à une balise.

  3. Cliquez sur Créer.

  4. Cliquez sur Sélectionner un modèle de fondation pour choisir le modèle de fondation que vous souhaitez ajuster.

    Cliquez sur une tuile pour afficher une fiche modèle avec des détails sur le modèle de fondation. Lorsque vous avez trouvé le modèle de base que vous souhaitez utiliser, cliquez sur Sélectionner.

    Pour plus d'informations, voir Choix d'un modèle de fondation à ajuster.

  5. Choisissez comment initialiser l'invite parmi les options suivantes :

    Texte
    Utilise le texte que vous spécifiez.
    Aléatoire
    Utilise les valeurs générées pour vous dans le cadre de l'expérience de réglage.

    Ces options sont liées à la méthode de réglage rapide pour les modèles de réglage. Pour plus d'informations sur la manière dont chaque option affecte l'expérience de réglage, voir Comment fonctionne le réglage rapide.

  6. Obligatoire pour la méthode d’initialisation de texte uniquement : ajoutez le texte d’initialisation que vous souhaitez inclure avec l’invite.

    • Pour une tâche de classification, donnez une instruction qui décrit ce que vous voulez classer et qui énumère les étiquettes de classe à utiliser. Par exemple, classez si le sentiment de chaque commentaire est positif ou négatif.
    • Pour une tâche générative, décrivez ce que vous voulez que le modèle fournisse en sortie. Par exemple, Justifiez la possibilité pour les employés de travailler à domicile quelques jours par semaine.
    • Pour une tâche de synthèse, donnez une instruction telle que : « Résumez les points principaux d'une transcription de réunion ».
  7. Choisissez un type de tâche.

    Choisissez le type de tâche qui correspond le mieux à ce que vous voulez que le modèle fasse :

    Classification
    Prédit les étiquettes catégoriques à partir des caractéristiques. Par exemple, étant donné un ensemble de commentaires de clients, vous pouvez vouloir étiqueter chaque déclaration comme une question ou un problème. En isolant les problèmes des clients, vous pouvez les identifier et les résoudre plus rapidement. Ce type de tâche gère la classification mono-étiquette.
    Génération
    Génère du texte. Par exemple, écrit un e-mail promotionnel.
    Récapitulation
    Génère un texte qui décrit les idées principales exprimées dans un corps de texte. Par exemple, résume un document de recherche.

    Quelle que soit la tâche choisie, l'entrée est soumise au modèle de base sous-jacent sous la forme d'une requête générative pendant l'expérience. Pour les tâches de classification, les noms de classes sont pris en compte dans les invites qui sont utilisées pour régler le modèle. À mesure que les modèles et les méthodes de réglage évoluent, des améliorations spécifiques aux tâches sont susceptibles d'être ajoutées et vous pourrez en tirer parti si les tâches sont représentées avec précision.

  8. Requis pour les tâches de classification uniquement : Dans le champ de sortie Classification, ajoutez les étiquettes de classe que vous souhaitez que le modèle utilise, une à la fois.

    Important : Spécifiez les mêmes étiquettes que celles utilisées dans vos données de formation.

    Au cours de l'expérience de réglage, les informations d'étiquette de classe sont soumises avec les exemples d'entrée des données d'apprentissage.

  9. Ajoutez les données de formation qui seront utilisées pour ajuster le modèle. Vous pouvez télécharger un fichier ou utiliser un élément de votre projet.

    Pour voir des exemples de mise en forme de fichier, développez À quoi doivent ressembler vos données?, puis cliquez sur Aperçu du modèle. Vous pouvez copier ou télécharger l'un des modèles de données pour le remplir avec vos propres données.

    Pour plus d'informations, voir Formats de données.

  10. Facultatif : si vous souhaitez limiter la taille des exemples d'entrée ou de sortie utilisés pendant la formation, ajustez le nombre maximum de jetons autorisés.

    Développer À quoi devraient ressembler vos données?, puis faites défiler pour voir les champs Maximum input tokens (Nombre maximum de jetons d'entrée ) et Maximum output tokens (Nombre maximum de jetons de sortie ). Faites glisser les curseurs pour modifier les valeurs. La limitation de la taille peut réduire le temps nécessaire à l'exécution de l'expérience d'accord. Pour plus d'informations, voir Contrôler le nombre de jetons utilisés.

  11. Facultatif : Cliquez sur Configurer les paramètres pour modifier les paramètres utilisés par l'expérience de réglage.

    La série de réglages est configurée avec des valeurs de paramètres qui représentent un bon point de départ pour le réglage d'un modèle. Vous pouvez les ajuster si vous le souhaitez.

    Pour plus d'informations sur les paramètres disponibles et leur fonction, voir Paramètres de réglage.

    Après avoir modifié les valeurs des paramètres, cliquez sur Enregistrer.

  12. Cliquez sur Démarrer le réglage.

L'expérience de réglage commence. Cela peut prendre de quelques minutes à quelques heures, selon la taille de vos données de formation et la disponibilité des ressources informatiques. Lorsque l'expérience est terminée, le statut indique qu'elle est terminée.

Un actif modèle optimisé n'est créé qu'après la création d'un déploiement à partir d'une expérience d'optimisation terminée. Pour plus d'informations, voir Déploiement d'un modèle optimisé.

Contrôler le nombre de jetons utilisés

Pour les modèles de langage naturel, les mots sont convertis en jetons. 256 jetons correspondent à environ 130 à 170 mots. 128 jetons correspondent à environ 65 à 85 mots. Cependant, les nombres de jetons sont difficiles à estimer et peuvent différer selon les modèles. Pour plus d'informations, voir Tokens et tokenisation.

Vous pouvez modifier le nombre de jetons autorisés dans l'entrée et la sortie du modèle lors d'une expérience de réglage par incréments.

Tableau 1 : Paramètres du numéro de jeton
Nom du paramètre : Valeur par défaut Options de valeur Options de valeur pour l' flan-t5-xl-3b e uniquement
Nombre maximal de jetons d'entrée 256 1–1024 1–256
Nombre maximal de jetons de sortie 128 1–512 1–128

Plus le nombre de jetons d'entrée et de sortie autorisés est élevé, plus le réglage du modèle prend du temps. Utilisez le plus petit nombre possible de jetons dans vos exemples, tout en représentant correctement votre cas d'utilisation.

Vous avez déjà un certain contrôle sur la taille de l'entrée. Le texte d'entrée utilisé lors d'une expérience d'apprentissage provient de vos données d'apprentissage. Ainsi, vous pouvez gérer la taille des entrées en limitant la longueur de vos exemples d'entrées. Cependant, il se peut que vous receviez des données de formation non organisées provenant d'une autre équipe ou d'un autre processus. Dans ce cas, vous pouvez utiliser le curseur Maximum input tokens pour gérer la taille d'entrée. Si vous réglez le paramètre sur 200 et que les données d'apprentissage ont une entrée d'exemple avec 1 000 jetons, par exemple, l'exemple est tronqué. Seuls les 200 premiers jetons de l'entrée d'exemple sont utilisés.

La valeur des jetons de sortie Max est importante car elle contrôle le nombre de jetons que le modèle est autorisé à générer en sortie lors de l'entraînement. Vous pouvez utiliser le curseur pour limiter la taille de la sortie, ce qui aide le modèle à générer une sortie concise.

Conseil : pour les tâches de classification, réduire la taille de la sortie est un bon moyen de forcer un modèle génératif à ne renvoyer que l'étiquette de classe, sans répéter le modèle de classification dans la sortie.

Évaluation de l'expérience de réglage

Lorsque l'expérience est terminée, un graphique de la fonction de perte est affiché, illustrant l'amélioration de la sortie du modèle au fil du temps. Les époques sont indiquées sur l'axe des abscisses et une mesure de la différence entre les résultats prévus et réels par époque est indiquée sur l'axe des ordonnées. La valeur affichée par époque est calculée à partir de la valeur moyenne du gradient de toutes les étapes d'accumulation de l'époque.

Pour plus d'informations sur la manière d'évaluer les résultats, voir Évaluer les résultats d'une expérience de réglage.

Lorsque vous êtes satisfait des résultats de l'expérience d'ajustement, déployez le modèle de base ajusté. Pour plus d'informations, voir Déploiement d'un modèle optimisé.

Réaliser à nouveau une expérience de réglage

Pour répéter une expérience d'accord, procédez comme suit :

  1. Depuis la page Actifs du projet, filtrez vos actifs par le type d'actif Expériences de réglage.
  2. Trouvez et ouvrez votre ressource d'expérimentation de réglage, puis cliquez sur Nouveau modèle réglé.

La fonction de perte pour l'expérience de réglage est représentée dans le même graphique avec les fonctions de perte des exécutions précédentes afin que vous puissiez les comparer.

Affiche un graphique de la fonction de perte avec les données de neuf séries d'expériences dans un seul graphique

En plus de l'actif modèle de fondation ajusté, l'expérience d'ajustement elle-même est enregistrée en tant qu'actif. Si les résultats d'une exécution antérieure de l'expérience sont meilleurs que ceux d'une exécution ultérieure, vous pouvez revenir à l'exécution antérieure de l'expérience et utiliser l'actif modèle résultant pour créer un nouveau déploiement modèle optimisé.

En savoir plus

Sujet parent : Réglage des modèles de fondations