Alcuni piani di servizio addebitano l'utilizzo del calcolo e altri tipi di utilizzo delle risorse. Se sei il proprietario o l'amministratore dell'account IBM Cloud , puoi monitorare l'utilizzo delle risorse per garantire che i limiti non vengano superati.
Per i piani Lite, non puoi superare i limiti del piano. Devi aspettare fino all'inizio del tuo prossimo mese di fatturazione per utilizzare le risorse calcolate mensilmente. In alternativa, puoi eseguire l'upgrade a un piano a pagamento.
Per la maggior parte dei piani a pagamento, paghi per le risorse che gli strumenti e i processi forniti dal servizio consumano ogni mese.
Per visualizzare i costi del tuo piano, accedi a IBM Cloud, apri la tua istanza del servizio dal dashboard IBM Cloud e fai clic su Piano.
- CUH (Capacity unit hours) per l'utilizzo del calcolo
- Unità di risorse per l'inferenza foundation model
- Monitora la fatturazione mensile
CUH (Capacity unit hours) per l'utilizzo del calcolo
Molti strumenti utilizzano l'utilizzo del calcolo misurato in CUH (capacity unit hours). Un'ora unità di capacità è una quantità specifica di capacità di elaborazione con un costo impostato.
Che cosa si misura per il consumo di CUH?
Le risorse, misurate con unità di capacità oraria (CUH) o unità di risorse (RU), vengono consumate per far funzionare gli asset, non per lavorare negli strumenti. Cioè, non c'è alcun costo di consumo per la definizione di un esperimento in AutoAI, ma c'è un costo per l'esecuzione dell'esperimento per addestrare le pipeline di esperimenti. Allo stesso modo, non è previsto alcun addebito per la creazione di uno spazio di distribuzione o la definizione di un lavoro di distribuzione, ma è previsto un addebito per l'esecuzione di un lavoro di distribuzione o l'inferenza rispetto a un asset installato. Gli asset che vengono eseguiti continuamente, come i notebook Jupyter, gli asset RStudio e gli script Bash consumano le risorse per tutto il tempo in cui sono attivi.
Come viene calcolato l'utilizzo del calcolo
Diversi tipi di processi e diversi livelli di potenza di calcolo vengono fatturati a diverse velocità di unità di capacità all'ora. Ad esempio, la tariffa oraria per un processo di creazione profili dati è 6 unità di capacità.
L'utilizzo del calcolo per watsonx.ai Studio viene addebitato al minuto, con un costo minimo di 10 minuti0.16 ore). L'utilizzo del calcolo per watsonx.ai Runtime viene addebitato al minuto con un costo minimo di un minuto.
L'utilizzo del calcolo viene calcolato aggiungendo il numero minimo di minuti fatturati per ogni processo più il numero di minuti in cui il processo viene eseguito oltre i minuti minimi, quindi moltiplicando il totale per la tariffa unità di capacità per il processo.
La seguente tabella mostra esempi di come viene calcolato il CUH fatturato.
Intervallo | Tempo di utilizzo | Calcolo | Totale CUH fatturati |
---|---|---|---|
1 CUH/ora | 1 ora | 1 ora * 1 CUH/ora | 1 CUH |
2 CUH/ora | 45 minuti | 0.75 ore * 2 CUH/ora | 1.5 CUH |
6 CUH/ora | 5 minuti | 0.16 ore * 6 CUH/ora | 0.96 CUH. Si applica il costo minimo di watsonx.ai Studio. |
6 CUH/ora | 30 minuti | 0.5 ore * 6 CUH/ora | 3 CUH |
6 CUH/ora | 1 ora | 1 ora * 6 CUH/ora | 6 CUH |
Processi che utilizzano ore di unità di capacità
Alcuni tipi di processi, come AutoAI e Federated Learning, hanno una singola percentuale di calcolo per il runtime. Tuttavia, con molti strumenti hai una scelta di risorse di elaborazione per il runtime. L'editor del notebook, Data Refinery, SPSS Modelere altri strumenti hanno diverse velocità che riflettono la memoria e la potenza di calcolo per l'ambiente. Gli ambienti con maggiore memoria e potenza di elaborazione consumano ore di unità di capacità ad una velocità più elevata.
Questa tabella mostra ogni processo che utilizza CUH, dove viene eseguito e rispetto a quale servizio CUH viene fatturato e se è possibile scegliere da più di un ambiente. Seguire i link per visualizzare le tariffe CUH disponibili per ogni processo.
Strumento o processo | Spazio di lavoro | Servizio che fornisce CUH | Tassi CUH multipli? |
---|---|---|---|
Editor notebook | Progetto | studio watsonx.ai, Analytics Engine (Spark) | Tariffe multiple |
Richiamo dell'API di machine learning da un notebook | Progetto | runtime watsonx.ai | Tariffe multiple |
Data Refinery | Progetto | studio watsonx.ai | Tariffe multiple |
SPSS Modeler | Progetto | studio watsonx.ai | Tariffe multiple |
IDE RStudio | Progetto | studio watsonx.ai | Tariffe multiple |
Esperimenti di autoIA | Progetto | runtime watsonx.ai | Tariffe multiple |
Esperimenti di Decision Optimization | Spazi | runtime watsonx.ai | Tariffe multiple |
Esecuzione delle distribuzioni | Spazi | runtime watsonx.ai | Tariffe multiple |
Creazione profili | Progetto | studio watsonx.ai | Una tariffa |
Synthetic Data Generator | Progetto | studio watsonx.ai | Una tariffa |
Pipeline di orchestrazione | Progetto e spazio | studio watsonx.ai | Tariffe multiple |
Monitoraggio dell'utilizzo del calcolo
Puoi monitorare l'utilizzo del calcolo per tutti i servizi a livello dell'account. Per visualizzare l'utilizzo mensile di CUH per un servizio, apri l'istanza del servizio dal tuo dashboard IBM Cloud e fai clic su Piano.
È inoltre possibile monitorare l'utilizzo del calcolo in un progetto nella pagina Ambienti nella scheda Gestisci .
Per vedere il totale delle ore di capacità utilizzate e rimanenti per watsonx.ai Studio e watsonx.ai Runtime, consultare la pagina Environment Runtimes. Dal menu di navigazione, selezionare Amministrazione> runtime dell'ambiente. La pagina Runtime ambiente mostra i dettagli di CUH utilizzato dagli ambienti. È possibile calcolare la quantità di CUH utilizzata per i flussi di dati e la creazione di profili sottraendo la quantità utilizzata dagli ambienti dalla quantità totale utilizzata.
Unità di risorse per l'inferenza foundation model
Richiamare un foundation model per generare un output in risposta a un prompt è noto come inferenza. L'inferenza del modello di base è la misura nelle unità di risorsa (RU). Ogni RU equivale a 1.000 token. Un token è un'unità di testo di base (in genere 4 caratteri o 0.75 parole) utilizzata nell'input o nell'output di un prompt foundation model. Per i dettagli sui token, vedi Token.
La fatturazione delle unità di risorse si basa sulla tariffa della classe foundation model moltiplicata per il numero di token. I modelli di fondazione sono classificati in tre classi. Vedi Resource unit metering.
Monitoraggio dell'utilizzo dei token per l'inferenza foundation model
È possibile monitorare l'uso dei token foundation model in un progetto nella pagina Ambienti della scheda Gestione.
Monitoraggio della fatturazione mensile
Devi essere un amministratore o proprietario dell'account IBM Cloud per visualizzare le informazioni sull'utilizzo della risorsa.
Per visualizzare un riepilogo della fatturazione mensile, dal menu di navigazione, scegli Amministrazione> Account e fatturazione> Fatturazione e utilizzo. Viene aperto il dashboard di utilizzo di IBM Cloud . Per visualizzare l'utilizzo per ogni servizio, nella sezione Riepilogo dell'utilizzo , fai clic su Visualizza utilizzo.
Ulteriori informazioni
- Scelta delle risorse di elaborazione per l'esecuzione di strumenti nei progetti
- Esegui upgrade dei servizi
- Utilizzo del calcolo degli ambienti
- piani di offerta diwatsonx.ai Studio
- watsonx.ai Piani di esecuzione e utilizzo del calcolo
Argomento principale Gestione della piattaforma