Nachdem Sie Ihr benutzerdefiniertes foundation model in den Cloud-Objektspeicher hochgeladen haben, erstellen Sie eine Verbindung zum Modell und ein entsprechendes Modell-Asset. Verwenden Sie die Verbindung, um ein Modell-Asset in einem Projekt oder Raum zu erstellen.
Um ein Modell-Asset zu erstellen, fügen Sie eine Verbindung zum Modell hinzu und erstellen dann ein Modell-Asset. Wenn Sie Ihr benutzerdefiniertes foundation model zunächst in einem Projekt testen möchten (z. B. durch Auswertung in einem Jupyter-Notebook), fügen Sie Ihr benutzerdefiniertes foundation model zu einem Projekt hinzu und verschieben es dann in einen Bereich.
Nachdem Sie das Modell-Asset hinzugefügt haben, können Sie es bereitstellen und Prompt Lab verwenden, um es zu inferenzieren.
Wichtig:
Wenn Sie Ihr Modell in einen entfernten Cloud-Speicher hochladen, müssen Sie eine Verbindung herstellen, die auf Ihren persönlichen Anmeldedaten basiert. Bei der Fernspeicherung in der Cloud sind nur Verbindungen mit persönlichen Anmeldeinformationen zulässig. Infolgedessen erhalten andere Nutzer desselben Bereitstellungsraums keinen Zugriff auf den Modellinhalt, dürfen aber Rückschlüsse auf die Modellbereitstellungen ziehen. Stellen Sie die Verbindung mit Hilfe Ihres Zugangsschlüssels und Ihres geheimen Zugangsschlüssels her. Wie Sie persönliche Zugangsdaten für Ihr Konto aktivieren können, erfahren Sie unter Kontoeinstellungen.
Vorbereitende Schritte
Copy link to section
Sie müssen Aufgabenanmeldeinformationen aktivieren, um ein benutzerdefiniertes foundation model bereitstellen zu können. Weitere Informationen finden Sie unter Zugangsdaten für Aufgaben hinzufügen.
Copy to clipboardIn die Zwischenablage kopiertShow more
Globale Parameter für benutzerdefinierte Gründungsmodelle
Copy link to section
Sie können globale Parameter verwenden, um Ihre benutzerdefinierten Fundamentmodelle einzusetzen. Stellen Sie den Wert Ihres Basismodellparameters innerhalb des in der folgenden Tabelle angegebenen Bereichs ein. Wenn Sie dies nicht tun, kann Ihre Bereitstellung fehlschlagen und die Inferenz ist nicht möglich.
Globale Parameter für benutzerdefinierte Gründungsmodelle
Parameter
Typ
Spannweite der Werte
Standardwert
Beschreibung
dtype
Zeichenfolge
float16, bfloat16
float16
Verwenden Sie diesen Parameter, um den Datentyp für Ihr Modell anzugeben.
max_batch_size
Zahl
max_batch_size >= 1
256
Verwenden Sie diesen Parameter, um die maximale Losgröße für Ihr Modell festzulegen.
max_concurrent_requests
Zahl
max_concurrent_requests >= 1 und max_concurrent_requests >= max_batch_size
1024 Zeichen.
Verwenden Sie diesen Parameter, um die maximale Anzahl der gleichzeitigen Anfragen an Ihr Modell anzugeben. Dieser Parameter ist für Einsätze, die die watsonx-cfm-caikit-1.1 Software-Spezifikation verwenden, nicht verfügbar.
max_new_tokens
Zahl
max_new_tokens >= 20
2047
Verwenden Sie diesen Parameter, um die maximale Anzahl von Token anzugeben, die Ihr Modell für eine Inferenzanforderung erzeugt.
max_sequence_length
Zahl
max_sequence_length >= 20 und max_sequence_length > max_new_tokens
2.048
Verwenden Sie diesen Parameter, um die maximale Sequenzlänge für Ihr Modell anzugeben.