Einige Servicepläne berechnen die Rechenleistung und andere Arten der Ressourcennutzung. Wenn Sie der IBM Cloud -Kontoeigner oder -Administrator sind, können Sie die Ressourcennutzung überwachen, um sicherzustellen, dass die Grenzwerte nicht überschritten werden.
Bei Lite-Plänen können Sie die Limits des Plans nicht überschreiten. Sie müssen biszum Beginn des nächsten Abrechnungsmonats warten, um Ressourcen zu verwenden, diemonatlich berechnet werden. Alternativ können Sie Upgrade auf einen kostenpflichtigen Plan durchführen.
Bei den meisten gebührenpflichtigen Plänen zahlen Sie für die Ressourcen, die die Tools und Prozesse, die vom Service bereitgestellt werden, jeden Monat verbrauchen.
Zum Anzeigen der Kosten Ihres Plans melden Sie sich bei IBM Cloud an, öffnen Ihre Serviceinstanz über Ihr IBM Cloud-Dashboard und klicken auf Plan.
- Kapazitätseinheitenstunden (CUH) für Rechenleistung
- Ressourceneinheiten für die Inferenz des foundation model
- Monatliche Abrechnung überwachen
Kapazitätseinheitenstunden (CUH) für Rechenleistung
Viele Tools verbrauchen Rechenleistung, die in Kapazitätseinheitenstunden (CUH) gemessen wird. Unter einer Capacity-Unit-Stunde versteht man eine bestimmte MengeRechenkapazität mit festgelegtem Kostensatz.
Was wird für den CUH-Verbrauch gemessen?
Ressourcen, ob in Kapazitätseinheitsstunden (CUH) oder Ressourceneinheiten (RU) gemessen, werden für den Betrieb von Anlagen verbraucht, nicht für die Arbeit in Werkzeugen. Das heißt, dass für die Definition eines Experiments in AutoAI, keine Verbrauchsgebühr anfällt, aber für die Durchführung des Experiments zum Trainieren der Experimentierpipelines eine Gebühr erhoben wird. In ähnlicher Weise fallen keine Gebühren für die Erstellung eines Bereitstellungsbereichs oder die Definition eines Bereitstellungsjobs an, aber es fallen Kosten für die Ausführung eines Bereitstellungsjobs oder die Inferenz für eine implementierte Anlage an. Assets, die kontinuierlich ausgeführt werden, wie z. B. Jupyter-Notebooks, RStudio-Assets und Bash-Scripts, belegen Ressourcen, solange sie aktiv sind.
Berechnung der Rechenleistungsnutzung
Unterschiedliche Typen von Prozessen undunterschiedliche Stufen der Rechenleistung werden mit unterschiedlichen Preisen fürCapacity-Unit-Stunden in Rechnung gestellt. Der Stundensatz für einenDatenprofilerstellungsjob beispielsweise beläuft sich auf sechs Capacity-Units.
Die Nutzung von watsonx.ai Studio wird minutenweise abgerechnet, mit einer Mindestdauer von 10 Minuten0.16 Stunden). Die Nutzung von watsonx.ai Runtime wird minutenweise abgerechnet, mit einer Mindestdauer von einer Minute.
Die Rechenleistungsnutzung wird berechnet, indem die für jeden Prozess in Rechnunggestellte Anzahl Minuten und die Anzahl Minuten, die der Prozess über die MindestanzahlMinuten hinaus ausgeführt wird, addiert werden und der Gesamtbetrag dann mit demCapacity-Unit-Satz für den Prozess multipliziert wird.
Die folgende Tabelle enthält Beispiele für die Berechnung der in Rechnung gestellten CUH.
Preis | Nutzungszeit | Berechnung | Insgesamt in Rechnung gestellte CUH |
---|---|---|---|
1 CUH/Stunde | 1 Stunde | 1 Stunde * 1 CUH/Stunde | 1 KUH |
2 CUH/Stunde | 45 Minuten | 0.75 Stunden * 2 CUH/Stunde | 1.5 CUH |
6 CUH/Stunde | 5 Minuten | 0.16 Stunden * 6 CUH/Stunde | 0.96 CUH. Es gilt die Mindestgebühr für watsonx.ai Studio. |
6 CUH/Stunde | 30 Minuten | 0.5 Stunden * 6 CUH/Stunde | 3 CUH |
6 CUH/Stunde | 1 Stunde | 1 Stunde * 6 CUH/Stunde | 6 CUH |
Prozesse, die Capacity-Units verbrauchen
Einige Prozesstypen, wie z. B. AutoAI und Federated Learning, haben eine einzige Rechenrate für die Laufzeit. Mit vielen Tools haben Sie jedoch eine Auswahl an Rechenressourcen für die Runtime. Der Notebook-Editor, Data Refinery, SPSS Modelerund andere Tools haben unterschiedliche Geschwindigkeiten, die den Speicher und die Rechenleistung für die Umgebung widerspiegeln. Umgebungen mit mehr Speicher und Rechenleistung verbrauchen Capacity-Unit-Stunden miteinem höheren Satz.
In dieser Tabelle werden alle Prozesse angezeigt, die CUH konsumieren, wo sie ausgeführt werden, für welchen Service CUH in Rechnung gestellt wird und ob Sie aus mehreren Umgebungen auswählen können. Folgen Sie den Links, um die verfügbaren CUH-Raten für jeden Prozess anzuzeigen.
Tool oder Prozess | Arbeitsbereich | Service, der CUH bereitstellt | Mehrere CUH-Raten? |
---|---|---|---|
Notebookeditor | Projekt | watsonx.ai Studio, Analytics Engine (Spark) | Mehrere Tarife |
API für maschinelles Lernen über ein Notebook aufrufen | Projekt | watsonx.ai Laufzeit | Mehrere Tarife |
Data Refinery | Projekt | watsonx.ai Studio | Mehrere Tarife |
SPSS Modeler | Projekt | watsonx.ai Studio | Mehrere Tarife |
RStudio-IDE | Projekt | watsonx.ai Studio | Mehrere Tarife |
AutoAI-Experimente | Projekt | watsonx.ai Laufzeit | Mehrere Tarife |
Experimente zur Entscheidungsoptimierung | Bereiche | watsonx.ai Laufzeit | Mehrere Tarife |
Implementierungen ausführen | Bereiche | watsonx.ai Laufzeit | Mehrere Tarife |
Profilerstellung | Projekt | watsonx.ai Studio | Eine Rate |
Synthetic Data Generator | Projekt | watsonx.ai Studio | Eine Rate |
Orchestrierungspipelines | Projekt und Raum | watsonx.ai Studio | Mehrere Tarife |
Rechenauslastung überwachen
Sie können die Berechnungsnutzung für alle Services auf Kontoebene überwachen. Zum Anzeigen der monatlichen CUH-Nutzung für einen Service öffnen Sie die Serviceinstanz über Ihr IBM Cloud -Dashboard und klicken Sie auf Plan.
Sie können die Berechnungsverwendung in einem Projekt auch auf der Seite Umgebungen auf der Registerkarte Verwalten überwachen.
Die Gesamtzahl der verbrauchten und verbleibenden Kapazitätsstunden für watsonx.ai Studio und watsonx.ai Runtime können Sie auf der Seite Environment Runtimes einsehen. Wählen Sie im Navigationsmenü Verwaltung > Umgebungslaufzeitenaus. Auf der Seite Umgebungslaufzeiten werden Details des von Umgebungen verwendeten CUHangezeigt. Sie können die Menge der CUH berechnen, die Sie fürDatenabläufe und Profilerstellung verwenden, indem Sie den von den Umgebungen verwendetenBetrag von der verwendeten Gesamtmenge subtrahieren.
Ressourceneinheiten für die Inferenz des foundation model
Das Aufrufen eines foundation model zur Erzeugung von Ausgaben als Reaktion auf eine Eingabeaufforderung wird als Inferenzierung bezeichnet. Basismodellinferenz ist ein Maß in Ressourceneinheiten (RU). Jede RU entspricht 1.000 Tokens. Ein Token ist eine grundlegende Texteinheit (in der Regel 4 Zeichen oder 0.75 Wörter), die in der Eingabe oder Ausgabe für eine Eingabeaufforderung foundation model verwendet wird. Details zu Tokens finden Sie unter Tokens.
Die Abrechnung der Ressourceneinheiten erfolgt auf der Grundlage des Tarifs der foundation model, multipliziert mit der Anzahl der Token. Basismodelle werden in drei Klassen klassifiziert. Siehe Ressourceneinheitenmessung.
Überwachung der Token-Verwendung für die Inferenzierung des foundation model
Sie können die Verwendung von foundation model Token in einem Projekt auf der Seite Umgebungen auf der Registerkarte Verwalten überwachen.
Monatliche Abrechnung überwachen
Sie müssen Eigner oder Administrator eines IBM Cloud-Kontos sein, umRessourcennutzungsinformationen anzuzeigen.
Um eine Zusammenfassung Ihrer monatlichen Abrechnung anzuzeigen, wählen Sie im Navigationsmenü Verwaltung > Konto und Abrechnung > Abrechnung und Nutzungaus. Das Nutzungsdashboard für IBM Cloud wird geöffnet. Um die Nutzung für jeden Service anzuzeigen, klicken Sie im Abschnitt Nutzungszusammenfassung auf Nutzung anzeigen.
Weitere Informationen
- Rechenressourcen zum Ausführen von Tools in Projekten auswählen
- Upgrade für Services durchführen
- Rechenleistung für Umgebungen
- watsonx.ai Studio Angebotspläne
- watsonx.ai Laufzeitpläne und Rechenleistung
Übergeordnetes Thema: Plattform verwalten