Régler un foundation model avec le Tuning Studio pour guider un foundation model IA afin qu'il produise des résultats utiles.
- Autorisations requises
Pour réaliser des expériences de réglage, vous devez avoir le rôle Admin ou Editor dans un projet.
Tuning Studio n'est pas disponible avec tous les plans ou dans tous les centres de données. Voir les plans d'exécution dewatsonx.ai et la disponibilité régionale pour les services et les fonctionnalités.
- Titres de compétences requis
- Format des données
Tableau: JSON, JSONL
- Taille des données
- 50 à 10 000 paires d'exemples d'entrée et de sortie. La taille de fichier maximale est de 200 Mo.
Vous utilisez le Tuning Studio pour créer une version adaptée d'un foundation model existant.
Regardez une vidéo qui explique quand et pourquoi accorder un foundation model.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Les modèles de base sont des modèles d'IA qui sont pré-entraînés sur des téraoctets de données provenant d'Internet et d'autres ressources publiques. Ils sont inégalés dans leur capacité à prédire le prochain meilleur mot et à générer du langage. Alors que la génération du langage peut être utile pour le remue-méninges et stimuler la créativité, les modèles de base doivent généralement être guidés pour réaliser des tâches concrètes. L'optimisation des modèles et d'autres techniques, telles que l'extraction-génération augmentée, vous aident à utiliser les modèles de base de manière significative pour votre entreprise.
Avec le Tuning Studio, vous pouvez ajuster un foundation model plus petit pour améliorer ses performances dans les tâches de traitement du langage naturel telles que la classification, le résumé et la génération. Le tuning peut aider un foundation model plus petit à obtenir des résultats comparables à ceux des modèles plus grands de la même famille. En ajustant et en déployant le modèle plus petit, vous pouvez réduire les coûts d'inférence à long terme.
Tout comme l'ingénierie rapide, la mise au point d'un foundation model vous permet d'influencer le contenu et le format des résultats du foundation model. Il est essentiel de savoir ce que l'on attend d'un foundation model si l'on veut intégrer l'étape d'inférence d'un foundation model dans un flux de travail.
Le diagramme suivant illustre comment la mise au point d'un foundation model peut vous aider à guider le modèle pour qu'il produise des résultats utiles. Vous fournissez des données étiquetées qui peuvent inclure des informations exclusives inconnues du foundation model et qui illustrent le format et le type de résultats que vous souhaitez que le modèle renvoie. Vos exemples donnent au foundation model un modèle à suivre et à appliquer aux résultats futurs.
Au lieu de généraliser les tâches traditionnelles telles que la traduction de textes et la génération de textes ou de réponses, une fois que vous avez mis au point un foundation model, le résultat est plus adapté à vos besoins.
- Le texte généré ou les réponses peuvent suivre un style spécifique
- Le modèle optimisé peut récapituler ou extraire des informations comme vous le souhaitez
- Avec des invites beaucoup plus petites, le modèle optimisé peut classer le texte de manière efficace
Pour en savoir plus sur les cas où l'ajustement d'un modèle est la bonne approche, voir Quand ajuster un foundation model.
Flux de travaux
La mise au point d'un foundation model implique les tâches suivantes :
Des invites d'ingénieur qui fonctionnent bien avec le modèle que vous souhaitez utiliser.
La mise au point ne signifie pas que l'on peut faire l'impasse sur l'ingénierie rapide. L'expérimentation est nécessaire pour trouver le bon foundation model pour votre cas d'utilisation. Testez jusqu'à ce que vous compreniez quels sont les formats d'invite les plus susceptibles d'obtenir de bons résultats à partir du modèle. Vous pouvez utiliser le Prompt Lab invites pour soumettre des invites de test. Pour obtenir de l'aide, voir Prompt Lab
Trouvez le foundation model le plus grand qui convient le mieux à votre tâche.
Créez des données d'entraînement à utiliser pour l'ajustement du modèle.
Créez une expérimentation d'ajustement pour optimiser le modèle.
Evaluer le modèle optimisé.
Si nécessaire, modifiez les données d'entraînement ou les paramètres d'expérimentation et exécutez d'autres expérimentations jusqu'à ce que vous soyez satisfait des résultats.
Déployez le modèle optimisé.
Soumettez des demandes d'inférence au modèle optimisé.
Coûts d'optimisation du modèle de base
Le coût de la mise au point d'un foundation model est mesuré en unités d'heures de capacité, qui mesurent la consommation de ressources informatiques de l'expérience de mise au point. Pour plus d'informations, voir Mesure des heures d'unité de capacité.
Le coût d'inférence d'un modèle ajusté est mesuré en unités de ressources. Le tarif dépend de la classe de facturation du modèle. Un foundation model à accord rapide a la même classe de facturation que le foundation model qu'il accorde. Pour plus d'informations, voir Mesure de l'unité de ressource.
En savoir plus
Premiers pas
- Démarrage rapide : Ajuster un foundation model
- Exemple de cahier : Ajuster un modèle pour classer les documents du CFPB dans watsonx
- Exemple de cahier : Réglage de l'invite pour la classification multi-classe avec watsonx
Rubrique parent: Développement de solutions d'IA génératives