0 / 0
Torna alla versione inglese della documentazione
Dettagli di fatturazione per le risorse di IA generativa
Ultimo aggiornamento: 05 dic 2024
Dettagli di fatturazione per le risorse di IA generativa

Scoprite come viene misurato l'utilizzo degli asset di IA generativa utilizzando unità di risorse (RU), tariffe orarie o una tariffa fissa.

Per lavorare con risorse di intelligenza artificiale generativa con watsonx.ai Runtime è necessario utilizzare watsonx.ai. Panoramica di IBM watsonx.ai.

Esaminare i dettagli di come vengono misurate le risorse utilizzando:

  • Unità di risorse per misurare le attività di inferenza per i modelli di fondazione forniti da watsonx.ai
  • Tariffe orarie per i modelli di fondazione personalizzati importati e distribuiti con watsonx.ai.
  • Tariffe orarie per modelli di fondazione curati distribuiti su richiesta su hardware dedicato.
  • Tariffe forfettarie per pagina per l'estrazione del testo dei documenti.

Misurazione delle unità di risorse per i modelli di fondazione

Per l'elenco dei modelli di fondazione supportati e i relativi prezzi, vedere Modelli di fondazione supportati. Per l'elenco dei modelli di encoder supportati e dei relativi prezzi, vedere Modelli di encoder supportati.

Un'unità di risorse (RU) equivale a 1000 token dall'input e dall'output dell'inferenza del modello di fondazione. Un token è un'unità di testo di base (in genere 4 caratteri o 0.75 parole) utilizzata nell'input o nell'output di un modello di fondazione o per l'input di un modello di embedding.

A ogni modello di base fornito da IBM watsonx.ai viene assegnato un prezzo di inferenza per gli input e gli output. Il prezzo viene calcolato come multiplo del prezzo base di un'IF (00.0001 dollari). Ad esempio, un modello con un prezzo di 00.0006 dollari ha un moltiplicatore pari a 6 volte la tariffa base.

Importante: il piano prevede dei limiti al numero di richieste di inferenza al secondo inviate a un modello. Se un utente supera un limite di richieste di inferenza, una notifica del sistema fornisce una guida.

A un modello di fondazione prontamente sintonizzato viene assegnato lo stesso prezzo del modello di fondazione sottostante. Per informazioni sui modelli di fondazione sintonizzati, vedere Tuning Studio. La messa a punto di un modello in Tuning Studio consuma ore di capacità (CUH). Per ulteriori informazioni, vedere Dettagli di fatturazione per le risorse di apprendimento automatico.

Calcolo del tasso di unità di risorse per modello

Per calcolare le spese per l'inferenza del modello di fondazione, dividere il numero totale di gettoni consumati durante il mese per 1000 e arrotondare per eccesso al 1000 più vicino per ottenere il numero totale di IF. Moltiplicare il numero totale di IF per il prezzo del modello per ottenere i costi di utilizzo totali. Il prezzo del modello varia a seconda del modello e può variare anche per i token di ingresso o di uscita di un determinato modello.

La formula di base è la seguente:

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

Il prezzo base di un'IF è di 00.0001 dollari. Il prezzo di ogni modello di fondazione è un multiplo del prezzo base.

Classi di fatturazione per moltiplicatore

Se si monitora l'utilizzo del modello con l'API di watsonx.ai, i prezzi dei modelli sono elencati per livelli di prezzo, come segue:

Tabella 1. Livelli di prezzo API
Modello di prezzo Prezzo per IF in USD Moltiplicatore
tasso base
Classe 1 $0.0006 6
Classe 2 $0.0018 18
Classe 3 $0.0050 50
Classe C1 $0.0001 1
Classe 5 $0.00025 2.5
Classe 7 $0.016 160
Classe 8 $0.00015 1.5
Classe 9 $0.00035 3.5
Classe 10 $0.0020 20
Classe 11 $0.000005 0.05
Classe 12 $0.0002 2
Nota:

Alcuni modelli, come il Mistral Large, hanno prezzi speciali che non sono assegnati da un moltiplicatore. I prezzi sono elencati nei modelli supportati.

Tariffe di fatturazione oraria per modelli di fondazione personalizzati

La distribuzione di modelli di fondazione personalizzati richiede il piano Standard.

Le tariffe di fatturazione dipendono dalla configurazione hardware del modello e si applicano per l'hosting e l'inferenza del modello. Gli addebiti iniziano quando il modello viene distribuito con successo e continuano finché il modello non viene cancellato.

Tabella 2. Tariffe di fatturazione del modello di fondazione personalizzato
Dimensione della configurazione Tariffa di fatturazione all'ora in USD
Piccolo $5.22
Medio $10.40
Grande $20.85
Importante: è possibile distribuire un massimo di quattro modelli di fondazione personalizzati piccoli, due modelli medi o un modello grande per account.

Per i dettagli sulla scelta di una configurazione per un modello di fondazione personalizzato, vedere Pianificazione della distribuzione di un modello di fondazione personalizzato.

Tariffe di fatturazione oraria per i modelli deploy on demand

Distribuite i modelli di fondazione su richiesta quando desiderate una soluzione in hosting riservata all'uso esclusivo della vostra organizzazione. Solo i colleghi a cui si concede l'accesso all'installazione possono fare l'inferenza sul modello di fondazione. Un'implementazione dedicata significa interazioni più rapide e reattive, e consente di inviare messaggi con finestre contestuali di maggiore lunghezza. Le tariffe di fatturazione sono stabilite per ogni modello e si applicano per l'hosting e l'inferenza del modello. L'addebito inizia quando il modello viene schierato e continua finché non viene eliminato.

Nota: la distribuzione dei modelli di fondazione su richiesta richiede il piano Standard. Questa funzione è attualmente disponibile solo per il data center di Dallas.

Per maggiori dettagli sulla distribuzione di un modello di fondazione su richiesta, compresi i prezzi, vedere Modelli di fondazione supportati disponibili con watsonx.ai

Tariffe per pagina per l'estrazione del testo del documento

Utilizzate il metodo di estrazione del testo del documento dell'API REST di watsonx.ai per convertire i file PDF altamente strutturati e che utilizzano diagrammi e tabelle per trasmettere le informazioni, in un formato di file JSON adatto ai modelli AI.

La fatturazione viene addebitata a una tariffa forfettaria per pagina elaborata. Una pagina può essere una pagina di testo (fino a 1800 caratteri), un'immagine o un frame .tiff. La tariffa di fatturazione dipende dal tipo di piano.

Tabella 3. Prezzi per l'estrazione del testo
Tipo di piano Prezzo per pagina in USD
Essenziale $0.038
Standard $0.030

Ulteriori informazioni

Argomento principale: Piani di esecuzione diwatsonx.ai

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni