0 / 0
Zurück zur englischen Version der Dokumentation

Abrechnungsdetails für generative AI-Assets

Letzte Aktualisierung: 14. Feb. 2025
Abrechnungsdetails für generative AI-Assets

Erfahren Sie, wie die Nutzung von generativen KI-Assets anhand von Ressourceneinheiten (RU), Stundensätzen oder einem Pauschalpreis gemessen wird.

Die Arbeit mit generativen KI-Assets mit watsonx.ai Runtime setzt voraus, dass Sie watsonx.ai verwenden. Überblick über IBM watsonx.ai.

Überprüfen Sie die Details, wie die Ressourcen gemessen werden:

  • Ressourceneinheiten zur Messung von Schlussfolgerungsaktivitäten für Fundamentmodelle, bereitgestellt von watsonx.ai.
  • Stundensätze für benutzerdefinierte Basismodelle, die Sie mit watsonx.ai importieren und einsetzen.
  • Stundensätze für kuratierte Foundation-Modelle, die bei Bedarf auf dedizierter Hardware bereitgestellt werden.
  • Pauschalpreise pro Seite für die Textextraktion aus Dokumenten.

Eine Ressourceneinheit wird zur Messung der folgenden Ressourcen verwendet:

  • Token, die für die Ableitung eines Grundmodells verwendet werden, um Text oder Texteinbettungen zu generieren.
  • Datenpunkte, die von einem Zeitreihen-Grundmodell zur Vorhersage zukünftiger Werte verwendet werden.

Ressourceneinheitsmessung für die Ableitung von Fundamentmodellen

Eine Liste der unterstützten Fundamentmodelle und ihrer Preise finden Sie unter Unterstützte Fundamentmodelle. Eine Liste der unterstützten Gebermodelle und ihrer Preise finden Sie unter Unterstützte Gebermodelle.

Bei der Messung der Inferenz des Fundamentmodells entspricht eine Ressourceneinheit (RU) 1.000 Token aus dem Input und Output des Fundamentmodells. Ein Token ist eine grundlegende Texteinheit (in der Regel 4 Zeichen oder 0.75 Wörter), die in der Eingabe oder Ausgabe für eine Eingabeaufforderung eines Basismodells oder als Eingabe für ein Einbettungsmodell verwendet wird.

Jedem von IBM watsonx.ai bereitgestellten Basismodell wird ein Inferenzpreis für Input und Output zugewiesen. Der Preis ergibt sich aus einem Vielfachen des Basispreises für ein EVU (00.0001$). Ein Modell mit einem Preis von 00.0006 $ hat zum Beispiel einen Multiplikator von 6 mal dem Basissatz.

Wichtig: Die Anzahl der Inferencing-Anfragen pro Sekunde, die an ein Modell übermittelt werden, ist planmäßig begrenzt. Überschreitet ein Benutzer ein Limit für Inferenzanfragen, gibt eine Systembenachrichtigung Hinweise.

Einem zeitnah abgestimmten Stiftungsmodell wird der gleiche Preis zugewiesen wie dem zugrunde liegenden Stiftungsmodell. Informationen über abgestimmte Gründungsmodelle finden Sie unter Tuning Studio. Die Abstimmung eines Modells im Tuning Studio verbraucht Kapazitätsstunden (CUH). Weitere Informationen finden Sie unter Details zur Abrechnung von Assets für maschinelles Lernen.

Ressourceneinheitsmessung für die Ableitung von Zeitreihen-Grundmodellen

Bei der Messung der Prognosen des Fundamentmodells entspricht eine Ressourceneinheit (RU) 1.000 Datenpunkten in der Eingabe und Ausgabe des Fundamentmodells. Ein Datenpunkt ist eine Einheit von Eingabe- und Ausgabecontent, der als eine oder mehrere Zahlen ausgedrückt wird.

Abrechnungsklassen nach Multiplikator

Wenn Sie die Modellnutzung mit der watsonx.ai API überwachen, werden die Modellpreise wie folgt nach Preisstufen aufgelistet:

Tabelle 1. API-Preisstufen
Modell der Preisstufe Ressourcentyp Preis pro RU in USD Multiplikator
Basissatz
Klasse 1 Tokens $0.0006 6
Klasse 2 Tokens $0.0018 18
Klasse 3 Tokens $0.0050 50
Klasse C1 Tokens $0.0001 1
Klasse 5 Tokens $0.00025 2.5
Klasse 7 Tokens $0.016 160
Klasse 8 Tokens $0.00015 1.5
Klasse 9 Tokens $0.00035 3.5
Klasse 10 Tokens $0.0020 20
Klasse 11 Tokens $0.000005 0.05
Klasse 12 Tokens $0.0002 2
Klasse 13 Tokens $0.00071 7.1
Klasse 14 Datenpunkte $0.00013 1.3
Klasse 15 Datenpunkte $0.00038 3.8
Hinweis:

Bestimmte Modelle, wie z. B. der Mistral Large, haben spezielle Preise, die nicht durch einen Multiplikator bestimmt werden. Die Preise sind in unterstützten Modellen aufgeführt.

Berechnung des Ressourceneinheitspreises von Token pro Modell

Zur Berechnung der Kosten für die Inferenz des Stiftungsmodells teilen Sie die Gesamtzahl der während des Monats verbrauchten Token durch 1000 und runden auf die nächsten 1000 auf, um die Gesamtzahl der EVU zu erhalten. Multiplizieren Sie die Gesamtzahl der EVUs mit dem Modellpreis, um die Gesamtnutzungsgebühren zu erhalten. Der Modellpreis variiert je nach Modell und kann auch für Eingabe- oder Ausgabe-Token für ein bestimmtes Modell variieren.

Die Grundformel lautet wie folgt:

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

Der Grundpreis für ein EVU beträgt 00.0001$. Der Preis für jedes Stiftungsmodell ist ein Vielfaches des Grundpreises.

Berechnung der Ressourceneinheit von Datenpunkten pro Modell

Verwenden Sie die folgenden Gleichungen, um die Gebühren für die Prognose mit einem Zeitreihen-Grundmodell zu berechnen:

  • Eingabeberechnung: context length x number of series x number of channels
  • Outputberechnung: prediction length x number of series x number of channels

Diese Gleichungen verwenden die folgenden Parameter:

  • Die Kontextlänge bezieht sich auf die Anzahl der historischen Datenpunkte, die ein Zeitreihen-Grundmodell als Eingabe für Vorhersagen verwendet.
  • Eine Reihe ist eine Sammlung von Beobachtungen, die nacheinander im Laufe der Zeit gemacht werden. Wenn man beispielsweise die Aktienkurse vieler Unternehmen vergleicht, ist die beobachtete Aktienkursentwicklung für jedes Unternehmen eine separate Reihe.
  • Kanäle sind die spezifischen Merkmale oder Variablen, die innerhalb eines Zeitreihendatensatzes gemessen werden.
  • Die Vorhersagelänge ist die Anzahl der zukünftigen Datenpunkte, die das Modell vorhersagen soll.
Preisgestaltung nach Datenpunkten
Ressourcentyp Modell der Preisstufe Preis in USD pro RE
Eingabedatenpunkte Klasse 14 $0.00013
Ausgangsdatenpunkte Klasse 15 $0.00038

Das folgende Beispiel zeigt, wie die Kosten für eine Zeitreihenprognoseanforderung mit den folgenden Parametern berechnet werden:

Parameter zur Berechnung der Nutzung von Datenpunkten
Parameter Beispielmenge
Länge des Kontexts (Modell granite-ttm-1536-96-r2 ) 1.536
Kanäle 10
Zeitreihe 1000
Länge der Vorhersage 96
  • Gesamtzahl der Eingabedatenpunkte: 15.360.000 (Kontextlänge von 1.536, 10 Kanäle, für 1.000 Serien)

    15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
    
  • Gesamtzahl der ausgegebenen Datenpunkte: 960.000 (Prognose für 96 Zeitpunkte, 10 Kanäle, für 1.000 Serien)

    960,000 / 1,000 = 960 x 0.00038 = 0.3648
    
  • Gesamtpreis für die Zeitreihenprognose: 2.36 (Eingabekosten: 1.9968 + Ausgabekosten: 0.3648 )

    1.9968 + 0.3648 = 2.3616
    

Stundensätze für individuelle Gründungsmodelle

Für die Bereitstellung von benutzerdefinierten Basismodellen ist der Standardplan erforderlich.

Die Gebührensätze richten sich nach der Hardwarekonfiguration des Modells und gelten für das Hosting und die Inferenz des Modells. Die Gebühren beginnen, wenn das Modell erfolgreich eingesetzt wird, und laufen weiter, bis das Modell gelöscht wird.

Individuelle Abrechnungssätze für das Stiftungsmodell
Konfigurationsgröße Abrechnungssatz pro Stunde in USD
Klein $5.22
Mittel $10.40
Groß $20.85
Wichtig: Sie können maximal vier kleine, zwei mittlere oder ein großes benutzerdefinierte Gründungsmodelle pro Konto bereitstellen.

Einzelheiten zur Auswahl einer Konfiguration für ein benutzerdefiniertes Basismodell finden Sie unter Planung der Bereitstellung eines benutzerdefinierten Basismodells.

Stündliche Abrechnungssätze für Bereitstellungsmodelle auf Anfrage

Stellen Sie die Basismodelle bei Bedarf bereit, wenn Sie eine gehostete Lösung wünschen, die ausschließlich für die Nutzung durch Ihr Unternehmen reserviert ist. Nur Kollegen, denen Sie Zugriff auf die Bereitstellung gewähren, können auf das Basismodell zugreifen. Eine dedizierte Bereitstellung bedeutet schnellere und reaktionsschnellere Interaktionen und ermöglicht Eingabeaufforderungen mit größeren Kontextfenstern. Die Gebührensätze werden pro Modell festgelegt und gelten für das Hosting und die Inferenz des Modells. Die Aufladung beginnt, wenn das Modell eingesetzt wird, und dauert an, bis das Modell gelöscht wird.

Hinweis: Für die Bereitstellung von Foundation-Modellen nach Bedarf ist der Standardplan erforderlich.

Weitere Informationen zur Bereitstellung eines Foundation-Modells auf Anfrage, einschließlich der Preise, finden Sie unter "Unterstützte Foundation-Modelle" unter watsonx.ai.

Preise pro Seite für die Extraktion von Dokumententext

Verwenden Sie die Methode der Dokumentenextraktion der watsonx.ai REST API, um stark strukturierte PDF-Dateien mit Diagrammen und Tabellen in ein AI-Modell-freundliches JSON-Dateiformat zu konvertieren.

Die Abrechnung erfolgt pauschal pro bearbeitete Seite. Eine Seite kann eine Textseite (bis zu 1800 Zeichen), ein Bild oder ein .tiff-Frame sein. Der Abrechnungssatz hängt von der Art Ihres Tarifs ab.

Preise für die Textextraktion
Plantyp Preis pro Seite in USD
Wesentlich $0.038
Standardwert $0.030

Weitere Informationen

Übergeordnetes Thema: watsonx.ai Laufzeitpläne