Modelli di fondazione supportati in watsonx.ai
IBM Puoi lavorare con modelli di terze parti e con i modelli di base di IBM watsonx.ai. È possibile utilizzare i modelli di fondazione forniti da IBM e pronti per l'uso immediato, oppure distribuire modelli di fondazione su richiesta da utilizzare esclusivamente per la propria organizzazione.
Come scegliere un modello
Per esaminare i fattori che possono aiutarti a scegliere un modello, come le attività e le lingue supportate, consultare Scelta di un modello e Benchmark dei modelli Foundation.
Modelli di fondazione per metodo di posa
A seconda del metodo di distribuzione, è possibile utilizzare i modelli di base su hardware multi-tenant direttamente o distribuire i modelli su hardware dedicato per l'uso da parte della propria organizzazione. Per saperne di più sui vari modi in cui è possibile utilizzare i modelli, vedere Metodi di distribuzione dei modelli di base.
Fornito modelli di fondazioni pronti all'uso
Una raccolta di modelli open source e IBM foundation vengono distribuiti in IBM watsonx.ai. È possibile richiedere questi modelli di fondazione nel Prompt Lab o in modo programmatico.
IBM modelli di fondazione
La seguente tabella elenca i modelli di fondazione IBM supportati che IBM fornisce per l'inferenza.
L'uso è misurato in Unità Risorsa (RU); ogni unità equivale a 1.000 gettoni dall'input e dall'output dell'inferenza del modello di base. Per maggiori dettagli sulle modalità di calcolo e monitoraggio dei prezzi dei modelli, consultare la sezione Dettagli di fatturazione per gli asset di IA generativa.
È inoltre possibile accedere ad alcuni modelli di fondazioni dell' IBM, provenienti da archivi di terze parti, come ad esempio Hugging Face. I modelli di fondazione IBM ottenuti da un repository di terze parti non sono indennizzati da IBM. Solo i modelli di fondazione IBM a cui si accede da watsonx.ai sono indennizzati da IBM. Per ulteriori informazioni sulle tutele contrattuali relative all'indennizzo IBM, consultare il Contratto di collaborazione con il cliente IBM e la descrizione del servizio IBM watsonx.ai
Nome modello | ID modello API | Prezzo di USD/1,000 gettoni) |
Prezzo di USD/1,000 gettoni) |
Finestra contestuale (token di ingresso e di uscita) |
Ulteriori informazioni |
---|---|---|---|---|---|
granite-3-3-8b-instruct | ibm/granite-3-3-8b-instruct |
$0.0002 | $0.0002 | 131,072 | - Scheda modello - Sito web |
granite-13b-instruct-v2 | ibm/granite-13b-instruct-v2 |
$0.0006 | $0.0006 | 8,192 | - Scheda modello - Sito web - Documento di ricerca Nota : questo modello di fondazione può essere regolato rapidamente.
|
granite-8b-japanese | ibm/granite-8b-japanese |
$0.0006 | $0.0006 | 4.096 | - Scheda modello - Sito web - Documento di ricerca |
granite-3-2b-instruct | ibm/granite-3-2b-instruct |
$0.0001 | $0.0001 | 131,072 | - Scheda modello - Sito web - Documento di ricerca |
granite-3-8b-instruct | ibm/granite-3-8b-instruct |
$0.0002 | $0.0002 | 131,072 | - Scheda modello - Sito web - Documento di ricerca |
granite-3-2-8b-instruct | ibm/granite-3-2-8b-instruct |
$0.0002 | $0.0002 | 131,072 | - Scheda modello - Sito web - Documento di ricerca |
granite-guardian-3-2b | ibm/granite-guardian-3-2b |
$0.0001 | $0.0001 | 131,072 | - Scheda modello - Sito web |
granite-guardian-3-8b | ibm/granite-guardian-3-8b |
$0.0002 | $0.0002 | 131,072 | - Scheda modello - Sito web |
granite-3b-code-instruct | ibm/granite-3b-code-instruct |
$0.0006 | $0.0006 | 128.000 | - Scheda modello - Sito web - Documento di ricerca |
granite-8b-code-instruct | ibm/granite-8b-code-instruct |
$0.0006 | $0.0006 | 128.000 | - Scheda modello - Sito web - Documento di ricerca |
granite-20b-code-instruct | ibm/granite-20b-code-instruct |
$0.0006 | $0.0006 | 8,192 | - Scheda modello - Sito web - Documento di ricerca |
granite-34b-code-instruct | ibm/granite-34b-code-instruct |
$0.0006 | $0.0006 | 8,192 | - Scheda modello - Sito web - Documento di ricerca |
granite-vision-3-2-2b | ibm/granite-vision-3-2-2b |
$0.0001 | $0.0001 | 131,072 | - Scheda modello - Sito web - Documento di ricerca |
Nome modello | ID modello API | Prezzo di ingresso ( USD/1,000 punti dati) |
Prezzo di uscita ( USD/1,000 punti dati) |
Lunghezza del contesto Punti dati min |
Ulteriori informazioni |
---|---|---|---|---|---|
granite-ttm-512-96-r2 | ibm/granite-ttm-512-96-r2 |
$0.00013 | $0.00038 | 512 | - Scheda modello - Sito web - Documento di ricerca |
granite-ttm-1024-96-r2 | ibm/granite-ttm-1024-96-r2 |
$0.00013 | $0.00038 | 1.024 | - Scheda modello - Sito web - Documento di ricerca |
granite-ttm-1536-96-r2 | ibm/granite-ttm-1536-96-r2 |
$0.00013 | $0.00038 | 1,536 | - Scheda modello - Sito web - Documento di ricerca |
Modelli di fondazioni di terzi
La seguente tabella elenca i modelli di fondazione di terze parti supportati e forniti con watsonx.ai
L'uso è misurato in Unità Risorsa (RU); ogni unità equivale a 1.000 gettoni dall'input e dall'output dell'inferenza del modello di base. Per maggiori dettagli sulle modalità di calcolo e monitoraggio dei prezzi dei modelli, consultare la sezione Dettagli di fatturazione per gli asset di IA generativa.
Nome modello | ID modello API | di servizi | Prezzo di USD/1,000 gettoni) |
Prezzo di USD/1,000 gettoni) |
Finestra contestuale (token di ingresso e di uscita) |
Ulteriori informazioni |
---|---|---|---|---|---|---|
allam-1-13b-instruct | sdaia/allam-1-13b-instruct |
Centro nazionale per l'intelligenza artificiale e autorità saudita per i dati e l'intelligenza artificiale | $0.0018 | $0.0018 | 4.096 | - Scheda modello |
elyza-japanese-llama-2-7b-instruct | elyza/elyza-japanese-llama-2-7b-instruct |
ELYZA, Inc | $0.0018 | $0.0018 | 4.096 | - Scheda modello - Blog su note.com |
flan-t5-xl-3b | google/flan-t5-xl |
$0.0006 | $0.0006 | 4.096 | - Scheda modello - Carta di ricerca Nota : questo modello di fondazione può essere regolato rapidamente.
|
|
flan-t5-xxl-11b | google/flan-t5-xxl |
$0.0018 | $0.0018 | 4.096 | - Scheda modello " - Carta di ricerca |
|
flan-ul2-20b | google/flan-ul2 |
$0.0050 | $0.0050 | 4.096 | - Scheda modello - Carta di ricercaUL2 - Carta di ricerca Flan |
|
jais-13b-chat | core42/jais-13b-chat |
Introduzione, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) e Cerebras Systems | $0.0018 | $0.0018 | 2,048 | - Scheda modello " - Carta di ricerca |
llama-4-maverick-17b-128e-instruct-fp8 | meta-llama/llama-4-maverick-17b-128e-instruct-fp |
Meta | $0.00035 | $0.0014 | 131,072 | - Scheda modello - 'Meta AI blog |
llama-4-scout-17b-16e-instruct |
meta-llama/llama-4-scout-17b-16e-instruct |
Meta | Nessun costo durante l'anteprima | Nessun costo durante l'anteprima | 131,072 | - Scheda modello - 'Meta AI blog |
llama-3-3-70b-instruct | meta-llama/llama-3-3-70b-instruct |
Meta | $0.00071 | $0.00071 | 131,072 | - Scheda modello - 'Meta AI blog |
llama-3-2-1b-instruct | meta-llama/llama-3-2-1b-instruct |
Meta | $0.0001 | $0.0001 | 131,072 | - Scheda modello - 'Meta AI blog - Carta di ricerca |
llama-3-2-3b-instruct | meta-llama/llama-3-2-3b-instruct |
Meta | $0.00015 | $0.00015 | 131,072 | - Scheda modello - 'Meta AI blog - Carta di ricerca |
llama-3-2-11b-vision-instruct | meta-llama/llama-3-2-11b-vision-instruct |
Meta | $0.00035 | $0.00035 | 131,072 | - Scheda modello - 'Meta AI blog - Carta di ricerca |
llama-3-2-90b-vision-instruct | meta-llama/llama-3-2-90b-vision-instruct |
Meta | $0.0020 | $0.0020 | 131,072 | - Scheda modello - 'Meta AI blog - Carta di ricerca |
llama-guard-3-11b-vision | meta-llama/llama-guard-3-11b-vision |
Meta | $0.00035 | $0.00035 | 131,072 | - Scheda modello - 'Meta AI blog - Carta di ricerca |
llama-3-1-8b-instruct | meta-llama/llama-3-1-8b-instruct |
Meta | $0.0006 | $0.0006 | 131,072 | - Scheda modello - 'Meta AI blog |
llama-3-1-70b-instruct | meta-llama/llama-3-1-70b-instruct |
Meta | $0.0018 | $0.0018 | 131,072 | - Scheda modello - 'Meta AI blog |
llama-3-405b-instruct | meta-llama/llama-3-405b-instruct |
Meta | $0.0050 | $0.016 | 16.384 | - Scheda modello - 'Meta AI blog |
llama-2-13b-chat | meta-llama/llama-2-13b-chat |
Meta | $0.0006 | $0.0006 | 4.096 | - Scheda modello " - Carta di ricerca |
mistral-large | mistralai/mistral-large |
Mistral AI | $0.003 | $0.01 | 131,072 | - Scheda modello - Post sul blog per Mistral Large 2 |
mistral-medium-2505 | mistralai/mistral-medium-2505 |
Mistral AI | $0.003 | $0.010 | 131,072 | - Scheda modello - Blog post per Mistral Medium 3 |
mistral-small-3-1-24b-instruct-2503 | mistralai/mistral-small-3-1-24b-instruct-2503 |
Mistral AI | $0.0001 | $0.0003 | 131,072 | • Scheda modello • Post del blog per Mistral 3.1 |
mistral-small-24b-instruct-2501 | mistralai/mistral-small-24b-instruct-2501 |
Mistral AI | $0.00035 | $0.00035 | 32.768 | - Scheda modello - Blog post per Mistral Small 3 |
mixtral-8x7b-instruct-v01 | mistralai/mixtral-8x7b-instruct-v01 |
Mistral AI | $0.0006 | $0.0006 | 32.768 | - Scheda modello " - Carta di ricerca |
mt0-xxl-13b | bigscience/mt0-xxl |
BigScience | $0.0018 | $0.0018 | 4.096 | - Scheda modello " - Carta di ricerca |
pixtral-12b | mistralai/pixtral-12b |
Mistral AI | $0.00035 | $0.00035 | 128.000 | - Scheda modello - Blog post per Pixtral 12B |
Implementazione di modelli di fondazione on demand
Puoi lavorare con un modello di base da una serie di modelli curati dall' IBM, da utilizzare esclusivamente per la tua organizzazione.
IBM distribuire su richiesta modelli di fondazioni
La tabella seguente elenca i modelli di fondazioni e IBM i che è possibile utilizzare su richiesta.
Alcuni modelli di fondazioni dell' IBM e sono disponibili anche presso archivi di terze parti, come Hugging Face. I modelli di fondazione IBM ottenuti da un repository di terze parti non sono indennizzati da IBM. Solo i modelli di fondazione IBM a cui si accede da watsonx.ai sono indennizzati da IBM. Per ulteriori informazioni sulle tutele contrattuali relative all'indennizzo IBM, consultare il Contratto di collaborazione con il cliente IBM e la descrizione del servizio IBM watsonx.ai
Nome modello | Prezzo all'ora in USD | Categoria di hosting del modello | Finestra contestuale (token di ingresso e di uscita) |
---|---|---|---|
granite-3-3-8b-instruct | $5.22 | Piccolo | 131,072 |
granite-3-3-2b-instruct | $5.22 | Piccolo | 131,072 |
granite-3-2-8b-instruct | $5.22 | Piccolo | 131,072 |
granite-3-1-8b-base | $5.22 | Piccolo | 131,072 |
granite-8b-japanese | $5.22 | Piccolo | 4.096 |
granite-20b-multilingual | $5.22 | Piccolo | 8,192 |
granite-13b-chat-v2 | $5.22 | Piccolo | 8,192 |
granite-13b-instruct-v2 | $5.22 | Piccolo | 8,192 |
granite-3b-code-instruct | $5.22 | Piccolo | 128.000 |
granite-8b-code-instruct | $5.22 | Piccolo | 128.000 |
granite-20b-code-instruct | $5.22 | Piccolo | 8,192 |
granite-34b-code-instruct | $5.22 | Piccolo | 8,192 |
granite-20b-code-base-schema-linking | $5.22 | Piccolo | 8,192 |
granite-20b-code-base-sql-gen | $5.22 | Piccolo | 8,192 |
granite-3-8b-base | $5.22 | Piccolo | 4.096 |
Implementazione di modelli di base su richiesta di terze parti
La tabella seguente elenca i modelli di fondazioni di terze parti che è possibile utilizzare su richiesta.
Nome modello | di servizi | Prezzo all'ora in USD | Categoria di hosting del modello | Finestra contestuale (token di ingresso e di uscita) |
---|---|---|---|---|
allam-1-13b-instruct | Centro nazionale per l'intelligenza artificiale e autorità saudita per i dati e l'intelligenza artificiale | $5.22 | Piccolo | 4.096 |
codellama-34b-instruct-hf | Code Llama | $10.40 | Medio | 16.384 |
deepseek-r1-distill-llama-8b | DeepSeek AI | $5.22 | Piccolo | 131,072 |
deepseek-r1-distill-llama-70b | DeepSeek AI | $20.85 | Grande | 131,072 |
eurollm-1-7b-instruct | Progetto completo | $5.22 | Piccolo | 4.096 |
eurollm-9b-instruct | Progetto completo | $5.22 | Piccolo | 4.096 |
flan-t5-xl-3b | $5.22 | Piccolo | 4.096 | |
flan-t5-xxl-11b | $5.22 | Piccolo | 4.096 | |
flan-ul2-20b | $5.22 | Piccolo | 4.096 | |
llama-2-13b-chat | Meta | $5.22 | Piccolo | 4.096 |
llama-2-70b-chat | Meta | $20.85 | Grande | 4.096 |
llama-3-8b-instruct | Meta | $5.22 | Piccolo | 8,192 |
llama-3-70b-instruct | Meta | $20.85 | Grande | 8,192 |
llama-3-1-8b | Meta | $5.22 | Piccolo | 131,072 |
llama-3-1-70b | Meta | $20.85 | Grande | 131,072 |
llama-3-1-8b-instruct | Meta | $5.22 | Piccolo | 131,072 |
llama-3-1-70b-instruct | Meta | $20.85 | Grande | 131,072 |
llama-3-2-11b-vision-instruct | Meta | $5.22 | Piccolo | 131,072 |
llama-3-3-70b-instruct | Meta | $10.40 | Medio | 131,072 |
llama-3-3-70b-instruct-hf | Meta | $20.85 | Grande | 131,072 |
mixtral-8x7b-base | Mistral AI | $10.40 | Medio | 32.768 |
mixtral-8x7b-instruct-v01 | Mistral AI | $10.40 | Medio | 32.768 |
mistral-large-instruct-2407 | Mistral AI | $ 55.15 (vedi nota) | Grande | 131,072 |
mistral-large-instruct-2411 | Mistral AI | $ 55.15 (vedi nota) | Grande | 131,072 |
mistral-nemo-instruct-2407 | Mistral AI | $5.22 | Piccolo | 131,072 |
mt0-xxl-13b | BigScience | $5.22 | Piccolo | 4.096 |
poro-34b-chat | LumiOpen | $10.40 | Medio | 2,048 |
L'hosting dei modelli di fondazione mistral-large-instruct-2411 e mistral-large-instruct-2407 da Mistral AI per l'uso dedicato prevede una tariffa oraria di accesso. Il prezzo totale per l'hosting di questi modelli di fondazione deploy on demand è la somma del prezzo di accesso e del prezzo di hosting.
Hosting: $ 20.85 + Accesso: $ 34.30 = Totale: $ 55.15 USD all'ora
Ulteriori informazioni
- IBM modelli di fondazione
- Modelli di fondazioni di terzi
- Per ulteriori informazioni sui modelli di codificatori supportati da IBM per l'incorporamento e la riclassificazione del testo, vedere Modelli di codificatori supportati.
- Per un elenco dei modelli disponibili in ciascun centro dati regionale, vedere Disponibilità regionale dei modelli di fondazione.
- Per i dettagli sui prezzi dei modelli di fondazione, vedere Dettagli di fatturazione per le risorse generative di IA.
- Per informazioni sui prezzi e sulla limitazione delle tariffe, consultare i pianiwatsonx.ai Runtime.
Argomento principale: Soluzioni Gen AI