0 / 0
Zurück zur englischen Version der Dokumentation
watsonx.ai Laufzeit-Dienstleistungspläne
Letzte Aktualisierung: 04. Dez. 2024
watsonx.ai Laufzeit-Dienstleistungspläne

Sie verwenden watsonx.ai, die in Kapazitätseinheitsstunden (CUH) gemessen werden, wenn Sie AutoAI trainieren, Machine-Learning-Modelle ausführen oder eingesetzte Modelle bewerten. Sie verwenden watsonx.ai, gemessen an verbrauchten Token oder zu einem Stundensatz, wenn Sie Inferencing-Dienste mit Foundation-Modellen ausführen. In diesem Thema werden die verschiedenen Pläne beschrieben, die Sie auswählen können, welche Services eingeschlossen sind und wie IT-Ressourcen berechnet werden.

Hinweis: Der watsonx.ai Runtime Service war früher als Watson Machine Learning Service bekannt.

watsonx.ai Runtime in Cloud Pak for Data as a Service und watsonx

Wichtig:

Der watsonx.ai Runtime Plan enthält Details zu watsonx.ai. Watsonx.ai ist ein Studio mit integrierten Tools für die Arbeit mit generativer KI, basierend auf Basismodellen und Modellen für maschinelles Lernen. Wenn Sie Cloud Pak for Data as a Serviceverwenden, gelten die Details für das Arbeiten mit Basismodellen und die Inferenzierung von Messungen mit Ressourceneinheiten nicht für Ihren Plan.

Weitere Informationen zu watsonx.aifinden Sie unter:

Wenn Sie sowohl für watsonx als auch für Cloud Pak for Data as a Serviceaktiviert sind, können Sie zwischen den beiden Plattformen wechseln.

Auswahl eines watsonx.ai

watsonx.ai Runtime-Pläne regeln, wie Sie für Modelle, die Sie mit watsonx.ai Runtime trainieren und einsetzen, und für Prompts, die Sie mit Foundation-Modellen verwenden, abgerechnet werden. Wählen Sie einen Ihren Anforderungen entsprechenden Plan aus:

  • Lite ist ein kostenloser Plan mit begrenzter Kapazität. Wählen Sie diesen Plan, wenn Sie watsonx.ai Runtime evaluieren und die Funktionen ausprobieren möchten. Der Lite-Plan unterstützt nicht die Durchführung von Experimenten zur Abstimmung von foundation model auf watsonx.
  • Essentials ist ein nutzungsabhängiger Plan, der Ihnen die Flexibilität bietet, Modelle zu erstellen, bereitzustellen und zu verwalten, die Ihren Anforderungen entsprechen.
  • Standard ist ein Unternehmensplan mit hoher Kapazität, der alle Anforderungen eines Unternehmens an maschinelles Lernen unterstützt. Kapazitätseinheitenstunden werden zu einem Pauschalbetrag bereitgestellt, während der Verbrauch von Ressourceneinheiten nutzungsabhängige Bezahlung ist.

Einzelheiten zu den Tarifen und Preisen finden Sie unter " .

Wie der Ressourcenverbrauch verfolgt wird

Zu Mess- und Abrechnungszwecken werden Modelle des maschinellen Lernens und Einsätze oder Basismodelle mit diesen Gebührenmetriken gemessen:

  • Capacity Unit Hour (CUH)-Messungen berechnen den Ressourcenverbrauch pro Stundeneinheit für Nutzungs- und Abrechnungszwecke. CUH misst alle watsonx.ai mit Ausnahme der Inferenzierung des Foundation-Modells.

  • Die Ressourceneinheit (RU) misst den Verbrauch foundation model für die Inferenz. Inferencing ist der Prozess, bei dem das foundation model aufgerufen wird, um als Reaktion auf eine Aufforderung eine Ausgabe zu erzeugen. Jede RU entspricht 1.000 Tokens. Ein Token ist eine grundlegende Texteinheit (in der Regel 4 Zeichen oder 0.75 Wörter), die in der Eingabe oder Ausgabe für eine Eingabeaufforderung foundation model verwendet wird. Details zu Tokens finden Sie unter Tokens und Zerlegung in Tokens.

  • Der Stundensatz wird zur Berechnung der Gebühren für benutzerdefinierte Basismodelle verwendet, die Sie in watsonx.ai importieren und bereitstellen. Der Preis richtet sich nach der Größe der Konfiguration und wird für die Dauer der Bereitstellung des Modells berechnet.

  • Der Seitentarif wird zur Berechnung der Gebühren für die Extraktion von Dokumententext verwendet. Die Seitenrate wird je nach Plan festgelegt.

Was wird beim Ressourcenverbrauch gemessen?

Ressourcen, unabhängig davon, ob sie mit Kapazitätseinheitenstunden (CUH) oder Ressourceneinheiten (RU) gemessen werden, werden für die Ausführung von Assets und nicht für die Arbeit in Tools verbraucht. Das heißt, es gibt keine Verbrauchsgebühr für die Definition eines Experiments inAutoAI, Für die Durchführung des Experiments zum Trainieren der Experiment-Pipelines fallen jedoch Gebühren an. In ähnlicher Weise fallen keine Kosten für die Erstellung eines Bereitstellungsbereichs oder die Definition eines Bereitstellungsjobs an, aber es fallen Kosten für die Ausführung eines Bereitstellungsjobs oder die Inferenz für eine implementierte Anlage an. Assets, die kontinuierlich ausgeführt werden, wie z. B. Jupyter-Notebooks, RStudio-Assets, Bash-Skripte und benutzerdefinierte Modellbereitstellungen, verbrauchen so lange Ressourcen, wie sie aktiv sind.

Hinweis: Sie verwenden keine Tokens, wenn Sie die abgeleitete App für KI-Suche und -Antwort für diese Dokumentationssite verwenden.

watsonx.ai Laufzeitplan Details

Der Lite-Plan bietet genügend freie Ressourcen, um die Funktionalität von watsonx.aiauszuwerten. Anschließend können Sie basierend auf den Tarifoptionen und der Kapazität einen kostenpflichtigen Plan auswählen, der den Anforderungen Ihrer Organisation entspricht.

Tabelle 1 Details
Tarifoptionen Tarif „Lite" Allgemeine Informationen Standardwert
watsonx.ai Laufzeitnutzung in CUH 20 CUH pro Monat CUH-Abrechnung auf der Basis des CUH-Satzes multipliziert mit dem Verbrauch in Stunden 2500 CUH pro Monat
Basismodellinferenz in Tokens oder Ressourceneinheiten (RU) 50.000 Token pro Monat Nutzungsrechnung (1000 Tokens = 1 RU) Nutzungsrechnung (1000 Tokens = 1 RU)
Max. parallele Decision Optimization -Stapeljobs pro Bereitstellung 2 5 100
Pro Bereich beibehaltene Bereitstellungsjobs 100 1.000 3.000
Bereitstellungszeit bis zur Inaktivität 1 Tag 30 Tage 30 Tage
HIPAA-Unterstützung Nicht zutreffend Nicht zutreffend Nur Region Dallas
Muss in Ihrem IBM Cloud -Konto aktiviert sein
Ratenbegrenzung pro Plan-ID 2 Inferenzanforderungen pro Sekunde 8 Inferenzanforderungen pro Sekunde 8 Inferenzanforderungen pro Sekunde
Unterstützung für benutzerdefinierte Fundamentmodelle Nicht verfügbar Nicht verfügbar Abrechnung stündlich nach Konfiguration
Extraktion von Dokumententext Nicht verfügbar Abrechnung pro Seite Abrechnung pro Seite

Hinweis: Wenn Sie ein Upgrade von Essentials auf Standard durchführen, können Sie nicht zu einem Essentials-Plan zurückkehren. Sie müssen einen neuen Plan erstellen.

watsonx.ai Runtime Preisdetails

Weitere Informationen über Abrechnungssätze und die Berechnung des Ressourcenverbrauchs finden Sie unter:

Weitere Informationen

Übergeordnetes Thema: watsonx.ai Runtime

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen