Explorez les modèles de base IBM conçus pour prendre en charge les connaissances et les compétences fournies par la communauté open source. Explorez la taxonomie d’un foundation model pour trouver des lacunes dans les connaissances que vous pouvez combler en apportant des compétences.
IBM watsonx.ai prend en charge les modèles de base qui utilisent une nouvelle méthode d'ajustement de l'alignement d' IBM Research. L'alignement à grande échelle pour chatBots, ou LAB , est une méthode permettant d'ajouter de nouvelles connaissances et compétences aux modèles de base existants en générant des données synthétiques pour la nouvelle capacité, puis en utilisant les données générées pour ajuster les instructions du foundation model .
Au lieu de créer un nouveau foundation model à partir de zéro ou de créer un modèle dérivé avec un réglage fin, vous pouvez utiliser IntructLab pour augmenter un foundation model existant avec les capacités nécessaires à votre cas d'utilisation.
Les modèles de fondation suivants soutiennent les contributions communautaires de InstructLab:
- granite-7b-lab
- granite-20b-multilingual
Pour plus d'informations sur ces modèles de base, voir Modèles de base pris en charge.
Exploration des connaissances et des compétences
Lorsqu'un foundation model est formé avec des connaissances et des compétences fournies par la communauté open source, une page de taxonomie de modèle est disponible pour le modèle. La taxonomie montre une hiérarchie des connaissances et des compétences qui ont été apportées au foundation model , où chaque nœud final représente une compétence apportée.
À partir de la fiche modèle du foundation model dans Prompt Lab, cliquez sur Taxonomie de formation pour explorer les connaissances et les compétences qui ont été ajoutées au modèle à l'aide de la méthode de réglage LAB.
- Une compétence enseigne au modèle à faire quelque chose, comme écrire un e-mail promotionnel ou résumer un rapport. Lorsque vous fournissez une compétence, vous fournissez au moins cinq exemples de départ qui sont utilisés pour générer des données synthétiques pour l'entraînement.
- Les connaissances sont les données et les faits dont un modèle a besoin pour répondre plus précisément aux questions. Lorsque vous fournissez des connaissances, vous fournissez des données de mise à la terre et des paires de questions-réponses liées aux données.
Si une compétence dont vous avez besoin pour votre cas d'utilisation n'est pas disponible dans le foundation model , créez et contribuez à la compétence.
Compétences de contribution
Vous apportez des compétences à un foundation model d' InstructLab .
InstructLab est une initiative open source de Red Hat et IBM qui fournit une plateforme permettant d'augmenter les capacités d'un foundation model .
Pour commencer, rejoignez la communauté InstructLab sur GitHub .
Flux de travaux InstructLab
Le flux de travaux d'extension des modèles de base à partir de InstructLab comprend les étapes suivantes:
Les membres de la communauté expérimentent InstructLab-compatible modèles de fondation.
Si un domaine à améliorer est identifié, le membre de la communauté peut apporter de nouvelles compétences au foundation model .
Le foundation model est un modèle d'instructions optimisé à l'aide de la méthode d'alignement-réglage LAB avec des données de formation synthétiques générées à partir d'exemples fournis par le contributeur de compétences.
Une fois qu'une compétence contribuée est approuvée, la compétence est fusionnée dans une nouvelle version du foundation model , désormais améliorée avec des compétences personnalisées.
En savoir plus
- Blog Red Hat : Qu'est-ce InstructLab?
- IBM Research : une méthode plus rapide et systématique pour former de grands modèles linguistiques pour l'entreprise
- IBM Research : Qu'est-ce que l'alignement de l'IA ?
- Document de recherche sur LAB
Rubrique parent: Modèles de base pris en charge