InstructLab-kompatible Basismodelle
Lernen Sie IBM -Basismodelle kennen, die dazu konzipiert sind, Wissen und Kenntnisse zu unterstützen, die von der Open-Source-Community beigetragen werden. Erkunden Sie die Taxonomie eines Basismodells, um Wissenslücken zu finden, die Sie füllen können, indem Sie Skills einbringen.
IBM watsonx.ai unterstützt Basismodelle, die eine neuartige Ausrichtungsoptimierungsmethode von IBM Research verwenden. Large-Scale Alignment for chatBots( LAB) ist eine Methode zum Hinzufügen neuer Kenntnisse und Fähigkeiten zu vorhandenen Basismodellen, indem synthetische Daten für die neue Funktionalität generiert und anschließend die generierten Daten verwendet werden, um das Basismodell zu optimieren.
Anstatt ein neues Basismodell völlig neu zu erstellen oder ein abgeleitetes Modell mit Feinabstimmung zu erstellen, können Sie ein vorhandenes Basismodell mit den Funktionen erweitern, die für Ihren Anwendungsfall erforderlich sind.
Die folgenden Basismodelle unterstützen Community-Beiträge von InstructLab:
- granite-7b-lab
- granite-13b-chat-v2
- granite-20b-multilingual
- merlinite-7b
Weitere Informationen zu diesen Basismodellen finden Sie unter Unterstützte Basismodelle.
Kenntnisse und Fähigkeiten erkunden
Wenn ein Basismodell mit Wissen und Fähigkeiten trainiert wird, die von der Open-Source-Community beigetragen wurden, ist eine Modelltaxonomieseite für das Modell verfügbar. Die Taxonomie zeigt eine Hierarchie der Kenntnisse und Fähigkeiten, die zum Basismodell beigetragen wurden, wobei jeder Endknoten einen ergänzten Skill darstellt.
Klicken Sie auf der Modellkarte für das Basismodell in Prompt Lab auf Trainingstaxonomie , um das Wissen und die Kenntnisse zu untersuchen, die dem Modell mithilfe der Optimierungsmethode LAB hinzugefügt wurden.
- Ein Skill lehrt das Modell, etwas zu tun, wie zum Beispiel eine Werbe-E-Mail zu schreiben oder einen Bericht zusammenzufassen. Wenn Sie einen Skill beisteuern, geben Sie mindestens fünf Seedbeispiele an, die zum Generieren synthetischer Daten für das Training verwendet werden.
- Wissen ist die Daten und Fakten, die ein Modell benötigt, um Fragen genauer zu beantworten. Wenn Sie Wissen einbringen, stellen Sie Erdungsdaten und Frage-Antwort-Paare im Zusammenhang mit den Daten bereit.
Wenn ein Skill, den Sie für Ihren Anwendungsfall benötigen, im Basismodell nicht verfügbar ist, erstellen Sie den Skill und tragen Sie ihn bei.
Fähigkeiten beisteuern
Sie können Skills über InstructLabzu einem Basismodell beitragen.
InstructLab ist eine Open-Source-Initiative von Red Hat und IBM , die eine Plattform zur Erweiterung der Funktionalität eines Basismodells bereitstellt.
Nehmen Sie zunächst an der InstructLab -Community in GitHubteil.
Workflow InstructLab
Der Workflow für die Erweiterung von Basismodellen aus InstructLab besteht aus den folgenden Schritten:
Community-Mitglieder experimentieren mit InstructLab-kompatiblen Basismodellen.
Wenn ein Bereich für Verbesserungen identifiziert wird, kann das Community-Mitglied neue Fähigkeiten für das Basismodell einbringen.
Das Basismodell wird durch die Verwendung der Abgleichoptimierungsmethode LAB mit synthetischen Trainingsdaten optimiert, die aus Beispielen generiert werden, die vom Skillentwickler bereitgestellt werden.
Nachdem ein beitragendes Skills genehmigt wurde, wird das Skills zu einem neuen Build des Basismodells zusammengeführt, das jetzt mit angepassten Skills erweitert wird.
Weitere Informationen
- Red Hat -Blog: Was ist InstructLab?
- IBM Research: Eine schnellere, systematische Methode zum Trainieren großer Sprachmodelle für Unternehmen
- IBM Research: Was ist KI-Ausrichtung?
- Research paper on LAB
Übergeordnetes Thema: Unterstützte Basismodelle