Erfahren Sie, wie die Nutzung von generativen KI-Assets anhand von Ressourceneinheiten (RU), Stundensätzen oder einem Pauschalpreis gemessen wird.
Die Arbeit mit generativen KI-Assets mit watsonx.ai Runtime setzt voraus, dass Sie watsonx.ai verwenden. Überblick über IBM watsonx.ai.
Überprüfen Sie die Details, wie die Ressourcen gemessen werden:
- Von watsonx.ai bereitgestellte Ressourceneinheiten zur Messung von Inferenzaktivitäten für Stiftungsmodelle.
- Stundensätze für benutzerdefinierte Basismodelle, die Sie mit watsonx.ai importieren und einsetzen.
- Stundensätze für kuratierte Foundation-Modelle, die bei Bedarf auf dedizierter Hardware bereitgestellt werden.
- Pauschalpreise pro Seite für die Textextraktion aus Dokumenten.
Zählung der Ressourceneinheiten für Gründungsmodelle
Eine Liste der unterstützten Fundamentmodelle und ihrer Preise finden Sie unter Unterstützte Fundamentmodelle. Eine Liste der unterstützten Gebermodelle und ihrer Preise finden Sie unter Unterstützte Gebermodelle.
Eine Resource Unit (RU) entspricht 1000 Token aus dem Input und Output des Foundation Model Inferencing. Ein Token ist eine grundlegende Texteinheit (in der Regel 4 Zeichen oder 0.75 Wörter), die in der Eingabe oder Ausgabe für eine Eingabeaufforderung eines Basismodells oder als Eingabe für ein Einbettungsmodell verwendet wird.
Jedem von IBM watsonx.ai bereitgestellten Basismodell wird ein Inferenzpreis für Input und Output zugewiesen. Der Preis ergibt sich aus einem Vielfachen des Basispreises für ein EVU (00.0001$). Ein Modell mit einem Preis von 00.0006 $ hat zum Beispiel einen Multiplikator von 6 mal dem Basissatz.
Einem zeitnah abgestimmten Stiftungsmodell wird der gleiche Preis zugewiesen wie dem zugrunde liegenden Stiftungsmodell. Informationen über abgestimmte Gründungsmodelle finden Sie unter Tuning Studio. Die Abstimmung eines Modells im Tuning Studio verbraucht Kapazitätsstunden (CUH). Weitere Informationen finden Sie unter Details zur Abrechnung von Assets für maschinelles Lernen.
Berechnung des Satzes der Ressourceneinheit pro Modell
Zur Berechnung der Kosten für die Inferenz des Stiftungsmodells teilen Sie die Gesamtzahl der während des Monats verbrauchten Token durch 1000 und runden auf die nächsten 1000 auf, um die Gesamtzahl der EVU zu erhalten. Multiplizieren Sie die Gesamtzahl der EVUs mit dem Modellpreis, um die Gesamtnutzungsgebühren zu erhalten. Der Modellpreis variiert je nach Modell und kann auch für Eingabe- oder Ausgabe-Token für ein bestimmtes Modell variieren.
Die Grundformel lautet wie folgt:
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
Der Grundpreis für ein EVU beträgt 00.0001$. Der Preis für jedes Stiftungsmodell ist ein Vielfaches des Grundpreises.
Abrechnungsklassen nach Multiplikator
Wenn Sie die Modellnutzung mit der watsonx.ai API überwachen, werden die Modellpreise wie folgt nach Preisstufen aufgelistet:
Modell der Preisstufe | Preis pro RU in USD | Multiplikator Basissatz |
---|---|---|
Klasse 1 | $0.0006 | 6 |
Klasse 2 | $0.0018 | 18 |
Klasse 3 | $0.0050 | 50 |
Klasse C1 | $0.0001 | 1 |
Klasse 5 | $0.00025 | 2.5 |
Klasse 7 | $0.016 | 160 |
Klasse 8 | $0.00015 | 1.5 |
Klasse 9 | $0.00035 | 3.5 |
Klasse 10 | $0.0020 | 20 |
Klasse 11 | $0.000005 | 0.05 |
Klasse 12 | $0.0002 | 2 |
Bestimmte Modelle, wie z. B. der Mistral Large, haben spezielle Preise, die nicht durch einen Multiplikator bestimmt werden. Die Preise sind in unterstützten Modellen aufgeführt.
Stundensätze für individuelle Gründungsmodelle
Für die Bereitstellung von benutzerdefinierten Basismodellen ist der Standardplan erforderlich.
Die Gebührensätze richten sich nach der Hardwarekonfiguration des Modells und gelten für das Hosting und die Inferenz des Modells. Die Gebühren beginnen, wenn das Modell erfolgreich eingesetzt wird, und laufen weiter, bis das Modell gelöscht wird.
Konfigurationsgröße | Abrechnungssatz pro Stunde in USD |
---|---|
Klein | $5.22 |
Mittel | $10.40 |
Groß | $20.85 |
Einzelheiten zur Auswahl einer Konfiguration für ein benutzerdefiniertes Basismodell finden Sie unter Planung der Bereitstellung eines benutzerdefinierten Basismodells.
Stündliche Abrechnungssätze für Bereitstellungsmodelle auf Anfrage
Stellen Sie die Basismodelle bei Bedarf bereit, wenn Sie eine gehostete Lösung wünschen, die ausschließlich für die Nutzung durch Ihr Unternehmen reserviert ist. Nur Kollegen, denen Sie Zugriff auf die Bereitstellung gewähren, können auf das Basismodell zugreifen. Eine dedizierte Bereitstellung bedeutet schnellere und reaktionsschnellere Interaktionen und ermöglicht Eingabeaufforderungen mit größeren Kontextfenstern. Die Gebührensätze werden pro Modell festgelegt und gelten für das Hosting und die Inferenz des Modells. Die Aufladung beginnt, wenn das Modell eingesetzt wird, und dauert an, bis das Modell gelöscht wird.
Einzelheiten zur Bereitstellung eines Basismodells bei Bedarf, einschließlich der Preise, finden Sie unter Unterstützte Basismodelle, die mit watsonx.ai verfügbar sind.
Preise pro Seite für die Extraktion von Dokumententext
Verwenden Sie die Methode der Dokumentenextraktion der watsonx.ai REST API, um stark strukturierte PDF-Dateien mit Diagrammen und Tabellen in ein AI-Modell-freundliches JSON-Dateiformat zu konvertieren.
Die Abrechnung erfolgt pauschal pro bearbeitete Seite. Eine Seite kann eine Textseite (bis zu 1800 Zeichen), ein Bild oder ein .tiff-Frame sein. Der Abrechnungssatz hängt von der Art Ihres Tarifs ab.
Plantyp | Preis pro Seite in USD |
---|---|
Unverzichtbare | $0.038 |
Standardwert | $0.030 |
Weitere Informationen
- Einzelheiten zu den Preisen für maschinelle Lernressourcen finden Sie unter Abrechnungssätze für maschinelle Lernressourcen.
- Weitere Informationen zur Verfolgung der Zuweisung und des Verbrauchs von Computerressourcen finden Sie unter Laufzeitnutzung.
- Weitere Informationen zu den einzelnen Modellen finden Sie unter Unterstützte Stiftungsmodelle.
- Informationen zur regionalen Unterstützung für die einzelnen Modelle finden Sie unter Regionale Verfügbarkeit der Stiftungsmodelle.
Übergeordnetes Thema: watsonx.ai Laufzeitpläne