Sie verwenden watsonx.ai, die in Kapazitätseinheitsstunden (CUH) gemessen werden, wenn Sie AutoAI trainieren, Machine-Learning-Modelle ausführen oder eingesetzte Modelle bewerten. Sie verwenden watsonx.ai, gemessen an verbrauchten Token oder zu einem Stundensatz, wenn Sie Inferencing-Dienste mit Foundation-Modellen ausführen. In diesem Thema werden die verschiedenen Pläne beschrieben, die Sie auswählen können, welche Services eingeschlossen sind und wie IT-Ressourcen berechnet werden.
watsonx.ai Runtime in Cloud Pak for Data as a Service und watsonx
Der watsonx.ai Runtime Plan enthält Details zu watsonx.ai. Watsonx.ai ist ein Studio mit integrierten Tools für die Arbeit mit generativer KI, basierend auf Basismodellen und Modellen für maschinelles Lernen. Wenn Sie Cloud Pak for Data as a Serviceverwenden, gelten die Details für das Arbeiten mit Basismodellen und die Inferenzierung von Messungen mit Ressourceneinheiten nicht für Ihren Plan.
Weitere Informationen zu watsonx.aifinden Sie unter:
- Übersicht über IBM watsonx.ai
- Vergleich von IBM watsonx und Cloud Pak for Data as a Service
- Für IBM watsonx.ai
Wenn Sie sowohl für watsonx als auch für Cloud Pak for Data as a Serviceaktiviert sind, können Sie zwischen den beiden Plattformen wechseln.
Auswahl eines watsonx.ai
watsonx.ai Runtime-Pläne regeln, wie Sie für Modelle, die Sie mit watsonx.ai Runtime trainieren und einsetzen, und für Prompts, die Sie mit Foundation-Modellen verwenden, abgerechnet werden. Wählen Sie einen Ihren Anforderungen entsprechenden Plan aus:
- Lite ist ein kostenloser Plan mit begrenzter Kapazität. Wählen Sie diesen Plan, wenn Sie watsonx.ai Runtime evaluieren und die Funktionen ausprobieren möchten. Der Lite-Plan unterstützt nicht die Durchführung von Experimenten zur Abstimmung von foundation model auf watsonx.
- Essentials ist ein nutzungsabhängiger Plan, der Ihnen die Flexibilität bietet, Modelle zu erstellen, bereitzustellen und zu verwalten, die Ihren Anforderungen entsprechen.
- Standard ist ein Unternehmensplan mit hoher Kapazität, der alle Anforderungen eines Unternehmens an maschinelles Lernen unterstützt. Kapazitätseinheitenstunden werden zu einem Pauschalbetrag bereitgestellt, während der Verbrauch von Ressourceneinheiten nutzungsabhängige Bezahlung ist.
Einzelheiten zu den Tarifen und Preisen finden Sie unter " .
Wie der Ressourcenverbrauch verfolgt wird
Zu Mess- und Abrechnungszwecken werden Modelle des maschinellen Lernens und Einsätze oder Basismodelle mit diesen Gebührenmetriken gemessen:
Capacity Unit Hour (CUH)-Messungen berechnen den Ressourcenverbrauch pro Stundeneinheit für Nutzungs- und Abrechnungszwecke. CUH misst alle watsonx.ai mit Ausnahme der Inferenzierung des Foundation-Modells.
Die Ressourceneinheit (RU) misst den Verbrauch foundation model für die Inferenz. Inferencing ist der Prozess, bei dem das foundation model aufgerufen wird, um als Reaktion auf eine Aufforderung eine Ausgabe zu erzeugen. Jede RU entspricht 1.000 Tokens. Ein Token ist eine grundlegende Texteinheit (in der Regel 4 Zeichen oder 0.75 Wörter), die in der Eingabe oder Ausgabe für eine Eingabeaufforderung foundation model verwendet wird. Details zu Tokens finden Sie unter Tokens und Zerlegung in Tokens.
Der Stundensatz wird zur Berechnung der Gebühren für benutzerdefinierte Basismodelle verwendet, die Sie in watsonx.ai importieren und bereitstellen. Der Preis richtet sich nach der Größe der Konfiguration und wird für die Dauer der Bereitstellung des Modells berechnet.
Der Seitentarif wird zur Berechnung der Gebühren für die Extraktion von Dokumententext verwendet. Die Seitenrate wird je nach Plan festgelegt.
Was wird beim Ressourcenverbrauch gemessen?
Ressourcen, unabhängig davon, ob sie mit Kapazitätseinheitenstunden (CUH) oder Ressourceneinheiten (RU) gemessen werden, werden für die Ausführung von Assets und nicht für die Arbeit in Tools verbraucht. Das heißt, es gibt keine Verbrauchsgebühr für die Definition eines Experiments inAutoAI, Für die Durchführung des Experiments zum Trainieren der Experiment-Pipelines fallen jedoch Gebühren an. In ähnlicher Weise fallen keine Kosten für die Erstellung eines Bereitstellungsbereichs oder die Definition eines Bereitstellungsjobs an, aber es fallen Kosten für die Ausführung eines Bereitstellungsjobs oder die Inferenz für eine implementierte Anlage an. Assets, die kontinuierlich ausgeführt werden, wie z. B. Jupyter-Notebooks, RStudio-Assets, Bash-Skripte und benutzerdefinierte Modellbereitstellungen, verbrauchen so lange Ressourcen, wie sie aktiv sind.
watsonx.ai Laufzeitplan Details
Der Lite-Plan bietet genügend freie Ressourcen, um die Funktionalität von watsonx.aiauszuwerten. Anschließend können Sie basierend auf den Tarifoptionen und der Kapazität einen kostenpflichtigen Plan auswählen, der den Anforderungen Ihrer Organisation entspricht.
Tarifoptionen | Tarif „Lite" | Allgemeine Informationen | Standardwert |
---|---|---|---|
watsonx.ai Laufzeitnutzung in CUH | 20 CUH pro Monat | CUH-Abrechnung auf der Basis des CUH-Satzes multipliziert mit dem Verbrauch in Stunden | 2500 CUH pro Monat |
Basismodellinferenz in Tokens oder Ressourceneinheiten (RU) | 50.000 Token pro Monat | Nutzungsrechnung (1000 Tokens = 1 RU) | Nutzungsrechnung (1000 Tokens = 1 RU) |
Max. parallele Decision Optimization -Stapeljobs pro Bereitstellung | 2 | 5 | 100 |
Pro Bereich beibehaltene Bereitstellungsjobs | 100 | 1.000 | 3.000 |
Bereitstellungszeit bis zur Inaktivität | 1 Tag | 30 Tage | 30 Tage |
HIPAA-Unterstützung | Nicht zutreffend | Nicht zutreffend | Nur Region Dallas Muss in Ihrem IBM Cloud -Konto aktiviert sein |
Ratenbegrenzung pro Plan-ID | 2 Inferenzanforderungen pro Sekunde | 8 Inferenzanforderungen pro Sekunde | 8 Inferenzanforderungen pro Sekunde |
Unterstützung für benutzerdefinierte Fundamentmodelle | Nicht verfügbar | Nicht verfügbar | Abrechnung stündlich nach Konfiguration |
Extraktion von Dokumententext | Nicht verfügbar | Abrechnung pro Seite | Abrechnung pro Seite |
watsonx.ai Runtime Preisdetails
Weitere Informationen über Abrechnungssätze und die Berechnung des Ressourcenverbrauchs finden Sie unter:
Weitere Informationen
- Abrechnungsdetails für generative AI-Assets
- Abrechnungsdetails für maschinelles Lernen
- Weitere Informationen zur Verfolgung der Zuweisung und des Verbrauchs von Computerressourcen finden Sie unter Laufzeitnutzung.
Übergeordnetes Thema: watsonx.ai Runtime