0 / 0
Zurück zur englischen Version der Dokumentation
Bereitstellung von Basismodellen bei Bedarf (schneller Weg)
Letzte Aktualisierung: 05. Dez. 2024
Bereitstellung von Basismodellen bei Bedarf (schneller Weg)

Stellen Sie ein foundation model bei Bedarf in nur wenigen Schritten auf dedizierter Hardware bereit. IBM watsonx.ai bietet eine kuratierte Reihe beliebter Basismodelle, die Sie bei Bedarf in einem dedizierten Bereitstellungsbereich für die ausschließliche Nutzung durch Benutzer mit Zugang zu diesem Bereich bereitstellen können. Der schnellste Weg zur Bereitstellung eines foundation model nach Bedarf ist die Auswahl und Bereitstellung eines Modells aus dem Resource Hub.

Vorbereitende Schritte

  1. Sie müssen die Anmeldeinformationen für Ihre Aufgabe einrichten oder aktivieren, um Foundation-Modelle auf Abruf bereitzustellen. Weitere Informationen finden Sie unter Verwalten von Berechtigungsnachweisen für Aufgaben.
  2. Überprüfen Sie die unterstützten Architekturen für foundation model, die Bereitstellungsarten und andere Überlegungen für die Bereitstellung eines foundation model auf Abruf. Weitere Informationen finden Sie unter Bereitstellen von Foundation-Modellen auf Abruf.

Sehen Sie sich dieses Video an, um zu erfahren, wie Sie ein foundation model auf Abruf bereitstellen können.

Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.

Einsatz eines foundation model

Führen Sie die folgenden Schritte aus, um ein foundation model bei Bedarf über die Ressourcendrehscheibe bereitzustellen:

  1. Öffnen Sie die Ressourcendrehscheibe über das Navigationsmenü " Navigation Menü-Symbol.

    Tipp:

    Wählen Sie den Ordner Deploy-on-demand, um eine Liste der Modelle anzuzeigen, die Sie bei Bedarf einsetzen können.

  2. Suchen Sie im Abschnitt Stundenweise Bezahlung das Modell, das Sie auf Abruf bereitstellen möchten.

    Screenshot mit der Liste der für die On-Demand-Bereitstellung in der Ressourcendrehscheibe verfügbaren Gründungsmodelle

  3. Klicken Sie auf der Seite mit den Modelldetails auf Verteilen.

    Screenshot der Seite mit den Modelldetails

  4. Klicken Sie auf der Kachel für foundation model auf Bereitstellen und wählen Sie dann den Bereitstellungsbereich, in dem das foundation model bereitgestellt werden soll.

    Der Screenshot zeigt, wie man die Bereitstellung erstellt

    Wichtig:

    Sie können nur eine Instanz eines foundation model bei Bedarf in einem Bereitstellungsbereich bereitstellen. Wenn das ausgewählte Modell bereits eingesetzt ist, steht dem Benutzer der Link zum bestehenden Einsatz im Abschnitt Details zur Verfügung. Weitere Informationen finden Sie unter Fehlerbehebung bei watsonx.ai Runtime.

  5. Klicken Sie auf Erstellen.

Nachdem das Modell bereitgestellt wurde, können Sie das foundation model über das Prompt Lab oder die watsonx.ai API abfragen.

Bereitstellung testen

Führen Sie die folgenden Schritte aus, um ein foundation model zu testen, das auf Abruf bereitgestellt wird:

  1. Öffnen Sie in Ihrem Bereitstellungsbereich die Registerkarte " Bereitstellungen" und klicken Sie auf den Namen der Bereitstellung.

  2. Klicken Sie auf die Registerkarte Test, um einen Aufforderungstext einzugeben und eine Antwort von dem bereitgestellten Asset zu erhalten.

  3. Geben Sie die Testdaten in einem der folgenden Formate ein, je nachdem, welche Art von Asset Sie eingesetzt haben:

    a. Text: Geben Sie Texteingabedaten ein, um einen Textblock als Ausgabe zu erzeugen.
    b. Strom: Geben Sie Texteingabedaten ein, um einen Textstrom als Ausgabe zu erzeugen.
    c. JSON: Geben Sie JSON-Eingabedaten ein, um eine Ausgabe im JSON-Format zu erzeugen.

    foundation model auf Abruf bereitgestellt

  4. Klicken Sie auf Generieren, um Ergebnisse zu erhalten, die auf Ihrer Eingabeaufforderung basieren.

Verwaltung des Einsatzes

Greifen Sie auf Ihr foundation model zu, aktualisieren, skalieren oder löschen Sie es, das bei Bedarf über den Resource Hub bereitgestellt wird.

Zugriff auf das eingesetzte Modell

Sie können über den Link zur Bereitstellung auf das foundation model zugreifen, das bei Bedarf über die Ressourcendrehscheibe bereitgestellt wird.

Führen Sie die folgenden Schritte aus, um über die Ressourcendrehscheibe auf den Bereitstellungslink zuzugreifen:

  1. Gehen Sie über das Navigationsmenü zur Ressourcendrehscheibe.

  2. Wählen Sie aus dem Foundation-Modellkatalog in der Ressourcendrehscheibe das Modell aus, das Sie bereitgestellt haben.

  3. Klicken Sie im Abschnitt Details auf der Seite mit den Modelldetails auf den Link Einsatz.

    Zugriff auf das Modell, das bei Bedarf über die Ressourcendrehscheibe bereitgestellt wird

Alternativ können Sie auch auf der Seite mit den Bereitstellungsdetails auf die Details zu Ihrem On-Demand bereitgestellten foundation model zugreifen, z. B. auf die Bereitstellungs-ID, die Softwarespezifikation, das zugehörige Asset und mehr.

Zugriff auf das Deploy-on-Demand-Modell aus dem Deployment Space

Aktualisierung der Bereitstellung

Aktualisieren Sie die erforderlichen Details für Ihr foundation model, das bei Bedarf bereitgestellt wird, wie Name, Beschreibung, Tags und mehr. Weitere Informationen finden Sie unter Aktualisieren einer Bereitstellung.

Einschränkung: Das Ersetzen des Assets wird bei Foundation-Modellen, die auf Abruf bereitgestellt werden, nicht unterstützt.

Aktualisierung des Deploy-on-demand-Modells aus dem Deployment Space

Skalierung des Einsatzes

Sie können nur eine Instanz eines foundation model auf Abruf in einem Bereitstellungsbereich bereitstellen. Um eine erhöhte Nachfrage zu bewältigen, können Sie die Bereitstellung skalieren, indem Sie zusätzliche Kopien erstellen. Weitere Informationen finden Sie unter Skalierung einer Bereitstellung.

Aktualisierung des Deploy-on-demand-Modells aus dem Deployment Space

Bereitstellung löschen

Wenn Ihre Arbeit mit dem auf Abruf bereitgestellten foundation model abgeschlossen ist, löschen Sie die Bereitstellung, um die Abrechnungsgebühren zu beenden. Weitere Informationen finden Sie unter Löschen einer Bereitstellung.

Weitere Informationen

Übergeordnetes Thema: Bereitstellung von Foundation-Modellen auf Abruf

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen