0 / 0
Torna alla versione inglese della documentazione
Dettagli di fatturazione per le risorse di IA generativa
Ultimo aggiornamento: 13 feb 2025
Dettagli di fatturazione per le risorse di IA generativa

Scoprite come viene misurato l'utilizzo degli asset di IA generativa utilizzando unità di risorse (RU), tariffe orarie o una tariffa fissa.

Per lavorare con risorse di intelligenza artificiale generativa con watsonx.ai Runtime è necessario utilizzare watsonx.ai. Per ulteriori informazioni su watsonx.ai, vedere Panoramica di IBM watsonx.ai.

Esaminare i dettagli di come vengono misurate le risorse utilizzando:

  • Unità di risorse per misurare le attività di inferenza per i modelli di fondazione fornite da watsonx.ai.
  • Tariffe orarie per i modelli di fondazione personalizzati importati e distribuiti con watsonx.ai.
  • Tariffe orarie per modelli di fondazione curati distribuiti su richiesta su hardware dedicato.
  • Tariffe forfettarie per pagina per l'estrazione del testo dei documenti.

Un'unità di risorse viene utilizzata per misurare le seguenti risorse:

  • Gettoni utilizzati per l'inferenza di un foundation model per generare testo o incorporazioni di testo.
  • Punti di dati utilizzati da una serie temporale foundation model per prevedere i valori futuri.

Misurazione delle unità di risorse per l'inferenza dei modelli di fondazione

Per l'elenco dei modelli di fondazione supportati per la generazione del testo e i relativi prezzi, vedere Modelli di fondazione supportati. Per l'elenco dei modelli di codifica supportati per il reranking e la generazione di incorporazioni di testo e i relativi prezzi, vedere Modelli di codifica supportati.

Quando si misura l'inferenza di foundation model, una Resource Unit (RU) equivale a 1.000 token dall'ingresso e dall'uscita di foundation model. Un token è un'unità di base di testo (tipicamente 4 caratteri o 0.75 parole) usata nell'input o nell'output di un prompt di foundation model o per l'input di un modello di embeddings.

A ogni foundation model fornito da IBM watsonx.ai viene assegnato un prezzo di inferenza per gli input e gli output. Il prezzo viene calcolato come multiplo del prezzo base di un'IF (00.0001 dollari). Ad esempio, un modello con un prezzo di 00.0006 dollari ha un moltiplicatore pari a 6 volte la tariffa base.

Importante: il piano prevede dei limiti al numero di richieste di inferenza al secondo inviate a un modello. Se un utente supera un limite di richieste di inferenza, una notifica del sistema fornisce una guida.

A un foundation model prontamente sintonizzato viene assegnato lo stesso prezzo del foundation model sottostante. Per informazioni sui modelli di fondazione sintonizzati, vedere Tuning Studio. La messa a punto di un modello in Tuning Studio consuma ore di capacità (CUH). Per ulteriori informazioni, vedere Dettagli di fatturazione per le risorse di apprendimento automatico.

Misurazione delle unità di risorse per l'inferenza dei modelli di fondazione delle serie temporali

Quando si misura la previsione di foundation model, un'unità di risorse (RU) equivale a 1.000 punti di dati in ingresso e in uscita da foundation model. Un punto dati è un'unità di contenuto di input e output espressa come uno o più numeri.

Classi di fatturazione per moltiplicatore

Se si monitora l'utilizzo del modello con l'API di watsonx.ai, i prezzi dei modelli sono elencati per livelli di prezzo, come segue:

Tabella 1. Livelli di prezzo API
Modello di prezzo Tipo di risorsa Prezzo per IF in USD Moltiplicatore
tasso base
Classe 1 Token $0.0006 6
Classe 2 Token $0.0018 18
Classe 3 Token $0.0050 50
Classe C1 Token $0.0001 1
Classe 5 Token $0.00025 2.5
Classe 7 Token $0.016 160
Classe 8 Token $0.00015 1.5
Classe 9 Token $0.00035 3.5
Classe 10 Token $0.0020 20
Classe 11 Token $0.000005 0.05
Classe 12 Token $0.0002 2
Classe 13 Token $0.00071 7.1
Classe 14 Punti di dati $0.00013 1.3
Classe 15 Punti di dati $0.00038 3.8
Nota:

Alcuni modelli, come il Mistral Large, hanno prezzi speciali che non sono assegnati da un moltiplicatore. I prezzi sono elencati nei modelli supportati.

Calcolo del tasso di unità di risorse di gettoni per modello

Per calcolare le spese per l'inferenza foundation model, dividere il numero totale di gettoni consumati durante il mese per 1000 e arrotondare per eccesso al 1000 più vicino per ottenere il numero totale di IF. Moltiplicare il numero totale di IF per il prezzo del modello per ottenere i costi di utilizzo totali. Il prezzo del modello varia a seconda del modello e può variare anche per i token di ingresso o di uscita di un determinato modello.

La formula di base è la seguente:

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

Il prezzo base di un'IF è di 00.0001 dollari. Il prezzo di ogni foundation model è un multiplo del prezzo base.

Calcolo del tasso unitario di risorse dei punti dati per modello

Per calcolare gli oneri di previsione con una serie temporale foundation model, utilizzare le seguenti equazioni:

  • Calcolo dell'ingresso: context length x number of series x number of channels
  • Calcolo dell'uscita: prediction length x number of series x number of channels

Queste equazioni utilizzano i seguenti parametri:

  • La lunghezza del contesto si riferisce al numero di punti di dati storici che una serie temporale foundation model utilizza come input per fare previsioni.
  • Una serie è un insieme di osservazioni effettuate in sequenza nel tempo. Ad esempio, quando si confrontano i prezzi delle azioni di molte società, la storia dei prezzi delle azioni osservate per ogni società è una serie separata.
  • I canali sono le caratteristiche o le variabili specifiche che vengono misurate all'interno di un set di dati di serie temporali.
  • La lunghezza della previsione è il numero di punti dati futuri che il modello deve prevedere.

Per ulteriori informazioni su questi valori, vedere Previsione dei valori dei dati futuri.

Prezzi dei punti dati
Tipo di risorsa Modello di prezzo Prezzo in USD per RU
Punti dati in ingresso Classe 14 $0.00013
Punti dati in uscita Classe 15 $0.00038

L'esempio seguente mostra come calcolare il costo per una richiesta di previsione di serie temporali con i seguenti parametri:

Parametri utilizzati per calcolare l'utilizzo dei punti dati
Parametro Esempio di quantità
Lunghezza del contesto (modello granite-ttm-1536-96-r2 ) 1,536
Canali 10
Serie 1.000
Lunghezza della previsione 96
  • Totale punti dati in ingresso: 15.360.000 (lunghezza del contesto di 1.536, 10 canali, per 1.000 serie)

    15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
    
  • Totale punti dati in uscita: 960.000 (previsione di 96 punti temporali, 10 canali, per 1.000 serie)

    960,000 / 1,000 = 960 x 0.00038 = 0.3648
    
  • Prezzo totale per la richiesta di previsione delle serie temporali: $ 2.36 (Costo di ingresso $ 1.9968 + Costo di uscita $ 0.3648 )

    1.9968 + 0.3648 = 2.3616
    

Tariffe di fatturazione oraria per modelli di fondazione personalizzati

La distribuzione di modelli di fondazione personalizzati richiede il piano Standard.

Le tariffe di fatturazione dipendono dalla configurazione hardware del modello e si applicano per l'hosting e l'inferenza del modello. Gli addebiti iniziano quando il modello viene distribuito con successo e continuano finché il modello non viene cancellato.

Tariffe di fatturazione foundation model personalizzato
Dimensione della configurazione Tariffa di fatturazione all'ora in USD
Piccolo $5.22
Medio $10.40
Grande $20.85
Importante: è possibile distribuire un massimo di quattro modelli di fondazione personalizzati piccoli, due modelli medi o un modello grande per account.

Per i dettagli sulla scelta di una configurazione per un foundation model personalizzato, vedere Pianificazione della distribuzione di un foundation model personalizzato.

Tariffe di fatturazione oraria per i modelli deploy on demand

Distribuite i modelli di fondazione su richiesta quando desiderate una soluzione in hosting riservata all'uso esclusivo della vostra organizzazione. Solo i colleghi a cui si concede l'accesso all'installazione possono fare l'inferenza sul foundation model. Un'implementazione dedicata significa interazioni più rapide e reattive e consente di inviare messaggi con finestre contestuali di maggiore lunghezza. Le tariffe di fatturazione sono stabilite per ogni modello e si applicano per l'hosting e l'inferenza del modello. L'addebito inizia quando il modello viene schierato e continua finché non viene eliminato.

Nota: la distribuzione dei modelli di fondazione su richiesta richiede il piano Standard.

Per informazioni dettagliate sull'implementazione di un' foundation model, compresi i prezzi, consultare i modelli di base supportati su watsonx.ai.

Tariffe per pagina per l'estrazione del testo del documento

Utilizzate il metodo di estrazione del testo del documento dell'API REST di watsonx.ai per convertire i file PDF altamente strutturati e che utilizzano diagrammi e tabelle per trasmettere le informazioni, in un formato di file JSON adatto ai modelli AI. Per ulteriori informazioni, vedere Estrazione di testo dai documenti.

La fatturazione viene addebitata a una tariffa forfettaria per pagina elaborata. Una pagina può essere una pagina di testo (fino a 1800 caratteri), un'immagine o un frame .tiff. La tariffa di fatturazione dipende dal tipo di piano.

Prezzi per l'estrazione del testo
Tipo di piano Prezzo per pagina in USD
Essential $0.038
Standard $0.030

Ulteriori informazioni

Argomento principale: Piani di esecuzione diwatsonx.ai