0 / 0
Zurück zur englischen Version der Dokumentation
InstructLab-kompatible Basismodelle

InstructLab-kompatible Basismodelle

Lernen Sie IBM -Basismodelle kennen, die dazu konzipiert sind, Wissen und Kenntnisse zu unterstützen, die von der Open-Source-Community beigetragen werden. Erkunden Sie die Taxonomie eines Basismodells, um Wissenslücken zu finden, die Sie füllen können, indem Sie Skills einbringen.

IBM watsonx.ai unterstützt Basismodelle, die eine neuartige Ausrichtungsoptimierungsmethode von IBM Research verwenden. Large-Scale Alignment for chatBots( LAB) ist eine Methode zum Hinzufügen neuer Kenntnisse und Fähigkeiten zu vorhandenen Basismodellen, indem synthetische Daten für die neue Funktionalität generiert und anschließend die generierten Daten verwendet werden, um das Basismodell zu optimieren.

Anstatt ein neues Basismodell völlig neu zu erstellen oder ein abgeleitetes Modell mit Feinabstimmung zu erstellen, können Sie ein vorhandenes Basismodell mit den Funktionen erweitern, die für Ihren Anwendungsfall erforderlich sind.

Die folgenden Basismodelle unterstützen Community-Beiträge von InstructLab:

  • granite-7b-lab
  • granite-13b-chat-v2
  • granite-20b-multilingual
  • merlinite-7b

Weitere Informationen zu diesen Basismodellen finden Sie unter Unterstützte Basismodelle.

Kenntnisse und Fähigkeiten erkunden

Wenn ein Basismodell mit Wissen und Fähigkeiten trainiert wird, die von der Open-Source-Community beigetragen wurden, ist eine Modelltaxonomieseite für das Modell verfügbar. Die Taxonomie zeigt eine Hierarchie der Kenntnisse und Fähigkeiten, die zum Basismodell beigetragen wurden, wobei jeder Endknoten einen ergänzten Skill darstellt.

Klicken Sie auf der Modellkarte für das Basismodell in Prompt Lab auf Trainingstaxonomie , um das Wissen und die Kenntnisse zu untersuchen, die dem Modell mithilfe der Optimierungsmethode LAB hinzugefügt wurden.

  • Ein Skill lehrt das Modell, etwas zu tun, wie zum Beispiel eine Werbe-E-Mail zu schreiben oder einen Bericht zusammenzufassen. Wenn Sie einen Skill beisteuern, geben Sie mindestens fünf Seedbeispiele an, die zum Generieren synthetischer Daten für das Training verwendet werden.
  • Wissen ist die Daten und Fakten, die ein Modell benötigt, um Fragen genauer zu beantworten. Wenn Sie Wissen einbringen, stellen Sie Erdungsdaten und Frage-Antwort-Paare im Zusammenhang mit den Daten bereit.

Wenn ein Skill, den Sie für Ihren Anwendungsfall benötigen, im Basismodell nicht verfügbar ist, erstellen Sie den Skill und tragen Sie ihn bei.

Fähigkeiten beisteuern

Sie können Skills über InstructLabzu einem Basismodell beitragen.

InstructLab ist eine Open-Source-Initiative von Red Hat und IBM , die eine Plattform zur Erweiterung der Funktionalität eines Basismodells bereitstellt.

Nehmen Sie zunächst an der InstructLab -Community in GitHubteil.

Workflow InstructLab

Zeigt einen kreisförmigen Ablauf, in dem Community-Mitglieder mit Skills experimentieren, IBM die LAB-Technik verwendet, um Skillbeiträge zusammenzuführen, IBM ein technologisch ausgereiftes Modell veröffentlicht und der Prozess dann von vorne beginnt.

Der Workflow für die Erweiterung von Basismodellen aus InstructLab besteht aus den folgenden Schritten:

  1. Community-Mitglieder experimentieren mit InstructLab-kompatiblen Basismodellen.

    Wenn ein Bereich für Verbesserungen identifiziert wird, kann das Community-Mitglied neue Fähigkeiten für das Basismodell einbringen.

  2. Das Basismodell wird durch die Verwendung der Abgleichoptimierungsmethode LAB mit synthetischen Trainingsdaten optimiert, die aus Beispielen generiert werden, die vom Skillentwickler bereitgestellt werden.

  3. Nachdem ein beitragendes Skills genehmigt wurde, wird das Skills zu einem neuen Build des Basismodells zusammengeführt, das jetzt mit angepassten Skills erweitert wird.

Weitere Informationen

Übergeordnetes Thema: Unterstützte Basismodelle

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen