Modelli di fondazione supportati in watsonx.ai

Ultimo aggiornamento: 04 apr 2025
Modelli di fondazione supportati in watsonx.ai

IBM Puoi lavorare con modelli di terze parti e con i modelli di base di IBM watsonx.ai. È possibile utilizzare i modelli di fondazione forniti da IBM e pronti per l'uso immediato, oppure distribuire modelli di fondazione su richiesta da utilizzare esclusivamente per la propria organizzazione.

Come scegliere un modello

Per esaminare i fattori che possono aiutarti a scegliere un modello, come le attività e le lingue supportate, consultare Scelta di un modello e Benchmark dei modelli Foundation.

Modelli di fondazione per metodo di posa

A seconda del metodo di distribuzione, è possibile utilizzare i modelli di base su hardware multi-tenant direttamente o distribuire i modelli su hardware dedicato per l'uso da parte della propria organizzazione. Per saperne di più sui vari modi in cui è possibile utilizzare i modelli, vedere Metodi di distribuzione dei modelli di base.

Tabella 1. Modelli di fondazione per metodo di posa
di servizi Fornito con watsonx.ai
(Pay per token)
Distribuzione su richiesta
(pagamento a ore)
IBM - granite-13b-instruct-v2
- granite-8b-japanese (Deprecated)
- granite-3-8b-base
- granite-20b-multilingual (Deprecato)
- granite-3-2b-instruct
- granite-3-8b-instruct
- granite-3-2-8b-instruct
- granite-guardian-3-2b
- granite-guardian-3-8b
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
- granite-vision-3-2-2b
granite-7b-lab
granite-8b-japanese
granite-13b-chat-v2
granite-13b-instruct-v2
granite-20b-multilingual
granite-3b-code-instruct
granite-8b-code-instruct
granite-20b-code-instruct
granite-34b-code-instruct
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Google flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
Meta - llama-3-3-70b-instruct
- llama-3-2-1b-instruct
- llama-3-2-3b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct
- llama-guard-3-11b-vision-instruct
- llama-3-1-8b-instruct (Deprecato)
- llama-3-1-70b-instruct (Deprecato)
- llama-2-13b-chat (Deprecato)
- llama-3-3-70b-instruct
llama-3-3-70b-instruct-hf
- llama-3-1-70b-istruzione
- llama-2-13b-chat
- llama-2-70b-chat
- llama-3-8b-instruct
- llama-3-70b-instruct
- llama-3-1-8b
- llama-3-1-8b-instruct
Mistral AI mistral-large
mistral-small-24b-instruct-2501
mixtral-8x7b-instruct-v01
pixtral-12b
mistral-large-instruct-2407
mistral-large-instruct-2411
mistral-nemo-instruct-2407
mixtral-8x7b-base
mixtral-8x7b-instruct-v01
BigScience mt0-xxl-13b
Code Llama
DeepSeek AI - deepseek-r1-distill-llama-8b
- deepseek-r1-distill-llama-70b
ELYZA, Inc elyza-japanese-llama-2-7b-instruct
Inception jais-13b-chat
SDAIA allam-1-13b-instruct allam-1-13b-instruct
Progetto di trascrizione e traduzione unificata per la realtà estesa (UTTER) - eurollm-1-7b-istruzioni
- eurollm-9b-instruct

Fornito modelli di fondazioni pronti all'uso

Una raccolta di modelli open source e IBM foundation vengono distribuiti in IBM watsonx.ai. È possibile richiedere questi modelli di fondazione nel Prompt Lab o in modo programmatico.

IBM modelli di fondazione

La seguente tabella elenca i modelli di fondazione IBM supportati che IBM fornisce per l'inferenza.

L'uso è misurato in Unità Risorsa (RU); ogni unità equivale a 1.000 gettoni dall'input e dall'output dell'inferenza del modello di base. Per maggiori dettagli sulle modalità di calcolo e monitoraggio dei prezzi dei modelli, consultare la sezione Dettagli di fatturazione per gli asset di IA generativa.

È inoltre possibile accedere ad alcuni modelli di fondazioni dell' IBM, provenienti da archivi di terze parti, come ad esempio Hugging Face. I modelli di fondazione IBM ottenuti da un repository di terze parti non sono indennizzati da IBM. Solo i modelli di fondazione IBM a cui si accede da watsonx.ai sono indennizzati da IBM. Per ulteriori informazioni sulle tutele contrattuali relative all'indennizzo IBM, consultare il Contratto di collaborazione con il cliente IBM e la descrizione del servizio IBM watsonx.ai

Tabella 2a. IBM modelli di base forniti con l' watsonx.ai e per l'inferenza
Nome modello ID modello API Prezzo di
USD/1,000 gettoni)
Prezzo di
USD/1,000 gettoni)
Finestra contestuale
(token di ingresso e di uscita)
Ulteriori informazioni
granite-13b-instruct-v2 ibm/granite-13b-instruct-v2 $0.0006 $0.0006 8,192 - Scheda modello
- Sito web
- Documento di ricerca
Nota : questo modello di fondazione può essere regolato rapidamente.
granite-8b-japanese ibm/granite-8b-japanese $0.0006 $0.0006 4.096 - Scheda modello
- Sito web
- Documento di ricerca
granite-20b-multilingual ibm/granite-20b-multilingual $0.0006 $0.0006 8,192 - Scheda modello
- Sito web
- Documento di ricerca
granite-3-2b-instruct ibm/granite-3-2b-instruct $0.0001 $0.0001 131,072 - Scheda modello
- Sito web
- Documento di ricerca
granite-3-8b-instruct ibm/granite-3-8b-instruct $0.0002 $0.0002 131,072 - Scheda modello
- Sito web
- Documento di ricerca
granite-3-2-8b-instruct ibm/granite-3-2-8b-instruct $0.0002 $0.0002 131,072 - Scheda modello
- Sito web
- Documento di ricerca
granite-guardian-3-2b ibm/granite-guardian-3-2b $0.0001 $0.0001 131,072 - Scheda modello
- Sito web
granite-guardian-3-8b ibm/granite-guardian-3-8b $0.0002 $0.0002 131,072 - Scheda modello
- Sito web
granite-3b-code-instruct ibm/granite-3b-code-instruct $0.0006 $0.0006 128.000 - Scheda modello
- Sito web
- Documento di ricerca
granite-8b-code-instruct ibm/granite-8b-code-instruct $0.0006 $0.0006 128.000 - Scheda modello
- Sito web
- Documento di ricerca
granite-20b-code-instruct ibm/granite-20b-code-instruct $0.0006 $0.0006 8,192 - Scheda modello
- Sito web
- Documento di ricerca
granite-34b-code-instruct ibm/granite-34b-code-instruct $0.0006 $0.0006 8,192 - Scheda modello
- Sito web
- Documento di ricerca
granite-vision-3-2-2b ibm/granite-vision-3-2-2b $0.0001 $0.0001 131,072 - Scheda modello
- Sito web
- Documento di ricerca

 

Tabella 2b. IBM modelli di fondazione forniti con watsonx.ai per la previsione dei valori futuri
Nome modello ID modello API Prezzo di ingresso
( USD/1,000 punti dati)
Prezzo di uscita
( USD/1,000 punti dati)
Lunghezza del contesto
Punti dati min
Ulteriori informazioni
granite-ttm-512-96-r2 ibm/granite-ttm-512-96-r2 $0.00013 $0.00038 512 - Scheda modello
- Sito web
- Documento di ricerca
granite-ttm-1024-96-r2 ibm/granite-ttm-1024-96-r2 $0.00013 $0.00038 1.024 - Scheda modello
- Sito web
- Documento di ricerca
granite-ttm-1536-96-r2 ibm/granite-ttm-1536-96-r2 $0.00013 $0.00038 1,536 - Scheda modello
- Sito web
- Documento di ricerca

 

Modelli di fondazioni di terzi

La seguente tabella elenca i modelli di fondazione di terze parti supportati e forniti con watsonx.ai

L'uso è misurato in Unità Risorsa (RU); ogni unità equivale a 1.000 gettoni dall'input e dall'output dell'inferenza del modello di base. Per maggiori dettagli sulle modalità di calcolo e monitoraggio dei prezzi dei modelli, consultare la sezione Dettagli di fatturazione per gli asset di IA generativa.

Tabella 3. Modelli di fondazione di terze parti forniti con watsonx.ai
Nome modello ID modello API di servizi Prezzo di
USD/1,000 gettoni)
Prezzo di
USD/1,000 gettoni)
Finestra contestuale
(token di ingresso e di uscita)
Ulteriori informazioni
allam-1-13b-instruct sdaia/allam-1-13b-instruct Centro nazionale per l'intelligenza artificiale e autorità saudita per i dati e l'intelligenza artificiale $0.0018 $0.0018 4.096 - Scheda modello
elyza-japanese-llama-2-7b-instruct elyza/elyza-japanese-llama-2-7b-instruct ELYZA, Inc $0.0018 $0.0018 4.096 - Scheda modello
- Blog su note.com
flan-t5-xl-3b google/flan-t5-xl Google $0.0006 $0.0006 4.096 - Scheda modello
- Carta di ricerca
Nota : questo modello di fondazione può essere regolato rapidamente.
flan-t5-xxl-11b google/flan-t5-xxl Google $0.0018 $0.0018 4.096 - Scheda modello
" - Carta di ricerca
flan-ul2-20b google/flan-ul2 Google $0.0050 $0.0050 4.096 - Scheda modello
- Carta di ricercaUL2
- Carta di ricerca Flan
jais-13b-chat core42/jais-13b-chat Introduzione, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) e Cerebras Systems $0.0018 $0.0018 2,048 - Scheda modello
" - Carta di ricerca
llama-3-3-70b-instruct meta-llama/llama-3-3-70b-instruct Meta $0.00071 $0.00071 131,072 - Scheda modello
- 'Meta AI blog
llama-3-2-1b-instruct meta-llama/llama-3-2-1b-instruct Meta $0.0001 $0.0001 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-3-2-3b-instruct meta-llama/llama-3-2-3b-instruct Meta $0.00015 $0.00015 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-3-2-11b-vision-instruct meta-llama/llama-3-2-11b-vision-instruct Meta $0.00035 $0.00035 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-3-2-90b-vision-instruct meta-llama/llama-3-2-90b-vision-instruct Meta $0.0020 $0.0020 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-guard-3-11b-vision meta-llama/llama-guard-3-11b-vision Meta $0.00035 $0.00035 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-3-1-8b-instruct meta-llama/llama-3-1-8b-instruct Meta $0.0006 $0.0006 131,072 - Scheda modello
- 'Meta AI blog
llama-3-1-70b-instruct meta-llama/llama-3-1-70b-instruct Meta $0.0018 $0.0018 131,072 - Scheda modello
- 'Meta AI blog
llama-3-405b-instruct meta-llama/llama-3-405b-instruct Meta $0.0050 $0.016 16.384 - Scheda modello
- 'Meta AI blog
llama-2-13b-chat meta-llama/llama-2-13b-chat Meta $0.0006 $0.0006 4.096 - Scheda modello
" - Carta di ricerca
mistral-large mistralai/mistral-large Mistral AI $0.003 $0.01 131,072 - Scheda modello
- Post sul blog per Mistral Large 2
mistral-small-24b-instruct-2501 mistralai/mistral-small-24b-instruct-2501 Mistral AI $0.00035 $0.00035 32.768 - Scheda modello
- Blog post per Mistral Small 3
mixtral-8x7b-instruct-v01 mistralai/mixtral-8x7b-instruct-v01 Mistral AI $0.0006 $0.0006 32.768 - Scheda modello
" - Carta di ricerca
mt0-xxl-13b bigscience/mt0-xxl BigScience $0.0018 $0.0018 4.096 - Scheda modello
" - Carta di ricerca
pixtral-12b mistralai/pixtral-12b Mistral AI $0.00035 $0.00035 128.000 - Scheda modello
- Blog post per Pixtral 12B

Implementazione di modelli di fondazione on demand

Puoi lavorare con un modello di base da una serie di modelli curati dall' IBM, da utilizzare esclusivamente per la tua organizzazione.

IBM distribuire su richiesta modelli di fondazioni

La tabella seguente elenca i modelli di fondazioni e IBM i che è possibile utilizzare su richiesta.

Alcuni modelli di fondazioni dell' IBM e sono disponibili anche presso archivi di terze parti, come Hugging Face. I modelli di fondazione IBM ottenuti da un repository di terze parti non sono indennizzati da IBM. Solo i modelli di fondazione IBM a cui si accede da watsonx.ai sono indennizzati da IBM. Per ulteriori informazioni sulle tutele contrattuali relative all'indennizzo IBM, consultare il Contratto di collaborazione con il cliente IBM e la descrizione del servizio IBM watsonx.ai

Tabella 4. Modelli di fondazione IBM disponibili per l'implementazione on demand in watsonx.ai
Nome modello Prezzo all'ora in USD Categoria di hosting del modello Finestra contestuale
(token di ingresso e di uscita)
granite-7b-lab $5.22 Piccolo 4.096
granite-8b-japanese $5.22 Piccolo 4.096
granite-20b-multilingual $5.22 Piccolo 8,192
granite-13b-chat-v2 $5.22 Piccolo 8,192
granite-13b-instruct-v2 $5.22 Piccolo 8,192
granite-3b-code-instruct $5.22 Piccolo 128.000
granite-8b-code-instruct $5.22 Piccolo 128.000
granite-20b-code-instruct $5.22 Piccolo 8,192
granite-34b-code-instruct $5.22 Piccolo 8,192
granite-20b-code-base-schema-linking $5.22 Piccolo 8,192
granite-20b-code-base-sql-gen $5.22 Piccolo 8,192
granite-3-8b-base $5.22 Piccolo 4.096

 

Implementazione di modelli di base su richiesta di terze parti

La tabella seguente elenca i modelli di fondazioni di terze parti che è possibile utilizzare su richiesta.

Tabella 5. Modelli di fondazione di terze parti disponibili per l'implementazione su richiesta in watsonx.ai
Nome modello di servizi Prezzo all'ora in USD Categoria di hosting del modello Finestra contestuale
(token di ingresso e di uscita)
allam-1-13b-instruct Centro nazionale per l'intelligenza artificiale e autorità saudita per i dati e l'intelligenza artificiale $5.22 Piccolo 4.096
deepseek-r1-distill-llama-8b DeepSeek AI $5.22 Piccolo 131,072
deepseek-r1-distill-llama-70b DeepSeek AI $20.85 Grande 131,072
eurollm-1-7b-instruct Progetto completo $5.22 Piccolo 4.096
eurollm-9b-instruct Progetto completo $5.22 Piccolo 4.096
flan-t5-xl-3b Google $5.22 Piccolo 4.096
flan-t5-xxl-11b Google $5.22 Piccolo 4.096
flan-ul2-20b Google $5.22 Piccolo 4.096
llama-2-13b-chat Meta $5.22 Piccolo 4.096
llama-2-70b-chat Meta $20.85 Grande 4.096
llama-3-8b-instruct Meta $5.22 Piccolo 8,192
llama-3-70b-instruct Meta $20.85 Grande 8,192
llama-3-1-8b Meta $5.22 Piccolo 131,072
llama-3-1-8b-instruct Meta $5.22 Piccolo 131,072
llama-3-1-70b-instruct Meta $20.85 Grande 131,072
llama-3-3-70b-instruct Meta $10.40 Medio 131,072
llama-3-3-70b-instruct-hf Meta $20.85 Grande 131,072
mixtral-8x7b-base Mistral AI $10.40 Medio 32.768
mixtral-8x7b-instruct-v01 Mistral AI $10.40 Medio 32.768
mistral-large-instruct-2407 Mistral AI $ 55.15 (vedi nota) Grande 131,072
mistral-large-instruct-2411 Mistral AI $ 55.15 (vedi nota) Grande 131,072
mistral-nemo-instruct-2407 Mistral AI $5.22 Piccolo 131,072
mt0-xxl-13b BigScience $5.22 Piccolo 4.096

 

Nota:L'hosting dei modelli di fondazione mistral-large-instruct-2411 e mistral-large-instruct-2407 da Mistral AI per l'uso dedicato prevede una tariffa oraria di accesso. Il prezzo totale per l'hosting di questi modelli di fondazione deploy on demand è la somma del prezzo di accesso e del prezzo di hosting.

Hosting: $ 20.85 + Accesso: $ 34.30 = Totale: $ 55.15 USD all'ora

Ulteriori informazioni

Argomento principale: Soluzioni Gen AI