0 / 0

Einsatz abgestimmter Gründungsmodelle

Letzte Aktualisierung: 01. Mai 2025
Einsatz abgestimmter Gründungsmodelle

Sie können ein Modell abstimmen, um es an eine bestimmte Aufgabe, einen Datensatz oder einen Anwendungsfall anzupassen. Der Tuning-Prozess passt die Parameter oder Gewichte eines vorab trainierten Modells an und verbessert die Leistung und Genauigkeit des Modells. Stellen Sie ein abgestimmtes Modell bereit, damit Sie es zu einem Geschäftsablauf hinzufügen und Foundation Models sinnvoll einsetzen können.

Wege zur Arbeit

Unabhängig davon, welche Methode Sie zum Abstimmen Ihres Modells verwenden, müssen Sie warten, bis das Abstimmungsexperiment abgeschlossen ist, bevor Sie das abgestimmte Modell einsetzen.

Je nach der Methode, die Sie für das Training Ihres Modells gewählt haben, können Sie abgestimmte Modelle auf die folgenden Arten einsetzen:

  • Von der Projekte-Benutzeroberfläche aus: Eine grafische Benutzeroberfläche zur Bereitstellung von abgestimmten Modellen, die als Tuning-Experiment-Assets in Ihrem Projekt gespeichert sind. Weitere Informationen finden Sie unter Bereitstellen eines getunten Modells aus einem Projekt.
  • Programmatische Methoden zum Einsatz abgestimmter Modelle: Verwenden Sie diese Methoden für parameter-effiziente fein abgestimmte Modelle (PEFT).

Nach der Bereitstellung eines abgestimmten Modells können Sie das Modell durch die Bereitstellung von Textdaten als Eingabe inferenzieren, um Vorhersagen in Echtzeit zu erstellen.

Bereitstellen eines abgestimmten Modells aus einem Projekt

Wenn Sie die Tuning Studio verwenden, um Ihr Tuning-Experiment zu erstellen, können Sie das resultierende getunte Modell direkt einsetzen.

Vorbereitende Schritte

Sie müssen Ihre Anmeldedaten für die Aufgabe einrichten, indem Sie einen API-Schlüssel erstellen. Weitere Informationen finden Sie unter Verwalten von Berechtigungsnachweisen für Aufgaben.

Vorgehensweise

Führen Sie die folgenden Schritte aus, um ein optimiertes Modell bereitzustellen:

  1. Klicken Sie auf der Registerkarte Assets des Projekts auf den Asset-Typ Experimente.

  2. Klicken Sie hier, um das Optimierungsexperiment für das Modell zu öffnen, das Sie implementieren möchten.

  3. Suchen Sie in der Liste Optimierte Modelle nach dem abgeschlossenen Optimierungsexperiment und klicken Sie anschließend auf Neue Bereitstellung.

  4. Benennen Sie das optimierte Modell.

    Der Name des Optimierungsexperiments wird als Name des optimierten Modells verwendet, wenn Sie ihn nicht ändern. Hinter dem Namen befindet sich eine Zahl in runden Klammern, die die Bereitstellungen zählt. Die Zahl beginnt bei 1 und wird jedes Mal, wenn Sie dieses Optimierungsexperiment implementieren, um 1 erhöht.

  5. Optional: Fügen Sie eine Beschreibung und Tags hinzu.

  6. Wählen Sie für den Einsatzcontainer eine der folgenden Optionen:

    • Dieses Projekt: Stellt das abgestimmte Modell bereit und fügt es zu Ihrem Projekt hinzu, wo Sie das abgestimmte Modell testen können. Sie können die abgestimmte Modellbereitstellung jederzeit in einen Bereitstellungsbereich verschieben. Wählen Sie diese Option, wenn Sie das abgestimmte Modell vor dem Einsatz in der Produktion weiter testen möchten.
    • Einsatzbereich: Versetzt das abgestimmte Modell in einen Bereitstellungsbereich und stellt das abgestimmte Modell bereit. Ein Bereitstellungsbereich ist von dem Projekt getrennt, in dem Sie das Asset erstellen. Diese Trennung ermöglicht es Ihnen, Assets aus mehreren Projekten in einen Bereich zu verschieben und Assets in mehr als einem Bereich einzusetzen. Wählen Sie diese Option, wenn das getunte Modell für die Produktion freigegeben werden soll.

    Weitere Informationen zu dieser Option finden Sie unter Verwendung eines Bereitstellungsraums.

    Tipp: Wählen Sie die Option zur Anzeige nach der Erstellung, damit Sie Ihr abgestimmtes Modell nach Abschluss des Bereitstellungsprozesses leicht finden können.
  7. Klicken Sie auf Bereitstellen.

Nachdem das abgestimmte Modell bereitgestellt wurde, wird eine Kopie des abgestimmten Modells in Ihrem Projekt als Modell-Asset gespeichert.

Verwendung eines Bereitstellungsraums

Wenn Sie einen Bereitstellungsbereich als Container für Ihr abgestimmtes Modell wählen, wird das abgestimmte Modell in einen Bereitstellungsbereich verschoben und dann bereitgestellt. Ein Bereitstellungsbereich ist den folgenden Services zugeordnet, die er zum Implementieren von Assets verwendet:

  • watsonx.ai Runtime: Ein Produkt mit Tools und Services, mit denen Sie Modelle für maschinelles Lernen erstellen, trainieren und einsetzen können. Dieser Service hostet Ihr gedrehte Modell.

  • IBM Cloud Object Storage: Eine sichere Plattform für die Speicherung strukturierter und unstrukturierter Daten. Ihr bereitgestelltes Modell-Asset wird in einem Cloud Object Storage Bucket gespeichert, das mit Ihrem Projekt verknüpft ist.

Weitere Informationen finden Sie in Bereitstellungsbereiche.

Um einen Bereitstellungsbereich zu verwenden, führen Sie die folgenden Schritte aus:

  1. Nachdem Sie Einsatzbereich als Einsatzcontainer gewählt haben, wählen Sie im Feld Ziel-Einsatzbereich einen Einsatzbereich.

    Der Bereitstellungsbereich muss einer Machine Learning-Instanz zugeordnet sein, die sich in demselben Konto wie das Projekt befindet, in dem das optimierte Modell erstellt wurde.

    Wenn Sie keinen Bereitstellungsbereich haben, wählen Sie Neuen Bereitstellungsbereich erstellenaus und befolgen Sie die Schritte unter Bereitstellungsbereiche erstellen.

  2. Fügen Sie im Feld Bereitstellungsname eine Beschriftung für die Implementierung hinzu.

    Der Servername wird in der URL für den API-Endpunkt verwendet, der Ihre Bereitstellung identifiziert. Das Hinzufügen eines Namens ist hilfreich, da der von Ihnen hinzugefügte lesbare Name eine lange, vom System generierte ID ersetzt, die andernfalls zugeordnet wird.

    Der Bereitstellungsname abstrahiert auch die Bereitstellung aus den zugehörigen Serviceinstanzdetails. Anwendungen können auf diesen Namen verweisen, wodurch die zugrunde liegende Serviceinstanz geändert werden kann, ohne dass sich dies auf Benutzer auswirkt.

    Der Name kann bis zu 36 Zeichen lang sein. Die unterstützten Zeichen sind [a-z,0-9, _].

    Der Name muss in der IBM Cloud -Region eindeutig sein. Möglicherweise werden Sie aufgefordert, den Serving-Namen zu ändern, wenn der ausgewählte Name bereits verwendet wird.

Abrufen des Modellbereitstellungsendpunkts

Führen Sie die folgenden Schritte aus, um den Endpunkt URL für Ihre abgestimmte Modellbereitstellung abzurufen:

  1. Klicken Sie auf der Registerkarte Bereitstellungen Ihres Projekts oder Bereitstellungsbereichs auf den Namen der Bereitstellung.
  2. Auf der Registerkarte API-Referenz finden Sie die Links zu privaten und öffentlichen Endpunkten sowie Codeausschnitte, mit denen Sie die Endpunktdetails in eine Anwendung einbinden können.

Sie benötigen den Modellendpunkt URL, um von Ihren Anwendungen aus auf die Bereitstellung zuzugreifen.

Nächste Schritte

Nachdem Sie ein abgestimmtes Modell bereitgestellt haben, können Sie Ihr Modell testen, indem Sie es inferieren. Sie können Ihre Modellbereitstellung verwalten, indem Sie die Bereitstellungsdetails aktualisieren, skalieren oder löschen.

Weitere Informationen

Übergeordnetes Thema: Vermögenswerte des Stiftungsmodells einsetzen