Scoprite come viene misurato l'utilizzo degli asset di IA generativa utilizzando unità di risorse (RU), tariffe orarie o una tariffa fissa.
Per lavorare con risorse di intelligenza artificiale generativa con watsonx.ai Runtime è necessario utilizzare watsonx.ai. Panoramica di IBM watsonx.ai.
Esaminare i dettagli di come vengono misurate le risorse utilizzando:
- Unità di risorse per misurare le attività di inferenza per i modelli di fondazione forniti da watsonx.ai
- Tariffe orarie per i modelli di fondazione personalizzati importati e distribuiti con watsonx.ai.
- Tariffe orarie per modelli di fondazione curati distribuiti su richiesta su hardware dedicato.
- Tariffe forfettarie per pagina per l'estrazione del testo dei documenti.
Misurazione delle unità di risorse per i modelli di fondazione
Per l'elenco dei modelli di fondazione supportati e i relativi prezzi, vedere Modelli di fondazione supportati. Per l'elenco dei modelli di encoder supportati e dei relativi prezzi, vedere Modelli di encoder supportati.
Un'unità di risorse (RU) equivale a 1000 token dall'input e dall'output dell'inferenza del modello di fondazione. Un token è un'unità di testo di base (in genere 4 caratteri o 0.75 parole) utilizzata nell'input o nell'output di un modello di fondazione o per l'input di un modello di embedding.
A ogni modello di base fornito da IBM watsonx.ai viene assegnato un prezzo di inferenza per gli input e gli output. Il prezzo viene calcolato come multiplo del prezzo base di un'IF (00.0001 dollari). Ad esempio, un modello con un prezzo di 00.0006 dollari ha un moltiplicatore pari a 6 volte la tariffa base.
A un modello di fondazione prontamente sintonizzato viene assegnato lo stesso prezzo del modello di fondazione sottostante. Per informazioni sui modelli di fondazione sintonizzati, vedere Tuning Studio. La messa a punto di un modello in Tuning Studio consuma ore di capacità (CUH). Per ulteriori informazioni, vedere Dettagli di fatturazione per le risorse di apprendimento automatico.
Calcolo del tasso di unità di risorse per modello
Per calcolare le spese per l'inferenza del modello di fondazione, dividere il numero totale di gettoni consumati durante il mese per 1000 e arrotondare per eccesso al 1000 più vicino per ottenere il numero totale di IF. Moltiplicare il numero totale di IF per il prezzo del modello per ottenere i costi di utilizzo totali. Il prezzo del modello varia a seconda del modello e può variare anche per i token di ingresso o di uscita di un determinato modello.
La formula di base è la seguente:
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
Il prezzo base di un'IF è di 00.0001 dollari. Il prezzo di ogni modello di fondazione è un multiplo del prezzo base.
Classi di fatturazione per moltiplicatore
Se si monitora l'utilizzo del modello con l'API di watsonx.ai, i prezzi dei modelli sono elencati per livelli di prezzo, come segue:
Modello di prezzo | Prezzo per IF in USD | Moltiplicatore tasso base |
---|---|---|
Classe 1 | $0.0006 | 6 |
Classe 2 | $0.0018 | 18 |
Classe 3 | $0.0050 | 50 |
Classe C1 | $0.0001 | 1 |
Classe 5 | $0.00025 | 2.5 |
Classe 7 | $0.016 | 160 |
Classe 8 | $0.00015 | 1.5 |
Classe 9 | $0.00035 | 3.5 |
Classe 10 | $0.0020 | 20 |
Classe 11 | $0.000005 | 0.05 |
Classe 12 | $0.0002 | 2 |
Alcuni modelli, come il Mistral Large, hanno prezzi speciali che non sono assegnati da un moltiplicatore. I prezzi sono elencati nei modelli supportati.
Tariffe di fatturazione oraria per modelli di fondazione personalizzati
La distribuzione di modelli di fondazione personalizzati richiede il piano Standard.
Le tariffe di fatturazione dipendono dalla configurazione hardware del modello e si applicano per l'hosting e l'inferenza del modello. Gli addebiti iniziano quando il modello viene distribuito con successo e continuano finché il modello non viene cancellato.
Dimensione della configurazione | Tariffa di fatturazione all'ora in USD |
---|---|
Piccolo | $5.22 |
Medio | $10.40 |
Grande | $20.85 |
Per i dettagli sulla scelta di una configurazione per un modello di fondazione personalizzato, vedere Pianificazione della distribuzione di un modello di fondazione personalizzato.
Tariffe di fatturazione oraria per i modelli deploy on demand
Distribuite i modelli di fondazione su richiesta quando desiderate una soluzione in hosting riservata all'uso esclusivo della vostra organizzazione. Solo i colleghi a cui si concede l'accesso all'installazione possono fare l'inferenza sul modello di fondazione. Un'implementazione dedicata significa interazioni più rapide e reattive, e consente di inviare messaggi con finestre contestuali di maggiore lunghezza. Le tariffe di fatturazione sono stabilite per ogni modello e si applicano per l'hosting e l'inferenza del modello. L'addebito inizia quando il modello viene schierato e continua finché non viene eliminato.
Per maggiori dettagli sulla distribuzione di un modello di fondazione su richiesta, compresi i prezzi, vedere Modelli di fondazione supportati disponibili con watsonx.ai
Tariffe per pagina per l'estrazione del testo del documento
Utilizzate il metodo di estrazione del testo del documento dell'API REST di watsonx.ai per convertire i file PDF altamente strutturati e che utilizzano diagrammi e tabelle per trasmettere le informazioni, in un formato di file JSON adatto ai modelli AI.
La fatturazione viene addebitata a una tariffa forfettaria per pagina elaborata. Una pagina può essere una pagina di testo (fino a 1800 caratteri), un'immagine o un frame .tiff. La tariffa di fatturazione dipende dal tipo di piano.
Tipo di piano | Prezzo per pagina in USD |
---|---|
Essenziale | $0.038 |
Standard | $0.030 |
Ulteriori informazioni
- Per informazioni dettagliate sui prezzi degli asset di apprendimento automatico, consultare le tariffe di fatturazione degli asset di apprendimento automatico.
- Per ulteriori informazioni sul monitoraggio dell'allocazione e del consumo delle risorse di calcolo, vedere Utilizzo del runtime.
- Per ulteriori informazioni su ciascun modello, vedere Modelli di fondazione supportati.
- Per informazioni sul supporto regionale di ciascun modello, vedere Disponibilità regionale dei modelli di fondazione.
Argomento principale: Piani di esecuzione diwatsonx.ai