0 / 0
Torna alla versione inglese della documentazione
Modelli di fondazione supportati in watsonx.ai
Ultimo aggiornamento: 18 dic 2024
Modelli di fondazione supportati in watsonx.ai

In IBM watsonx.ai è disponibile una raccolta di modelli open source e IBM foundation per l'inferenza. Trovate i modelli di base più adatti alle esigenze della vostra applicazione di IA generativa e al vostro budget.

I modelli di fondazione disponibili per l'inferenza da watsonx.ai sono ospitati in vari modi:

Modelli di fondazione forniti con watsonx.ai
Modelli di fondazione IBM, distribuiti su hardware multitenant da IBM e disponibili per l'inferenza. Si paga in base ai gettoni utilizzati. Vedere i modelli di Fondazione forniti con watsonx.ai
Implementazione di modelli di fondazione on demand
Un'istanza di un foundation model IBM che viene distribuita e che è dedicata all'uso dell'inferenza. Solo i colleghi a cui è stato concesso l'accesso all'installazione possono fare l'inferenza sul foundation model. Un'implementazione dedicata significa interazioni più rapide e reattive senza limiti di velocità. L'hosting del foundation model si paga a ore. Vedere Distribuzione di modelli di fondazione su richiesta.
Modelli di base personalizzati
Modelli Foundation curati dall'utente che vengono importati e distribuiti in watsonx.ai L'istanza del foundation model personalizzato che viene distribuita è dedicata all'utente. Un'implementazione dedicata significa interazioni più rapide e reattive. L'hosting del foundation model si paga a ore. Vedere Modelli di fondazione personalizzati.
Modelli di fondazione sintonizzati su richiesta
Un sottoinsieme dei modelli di fondazione disponibili, che può essere personalizzato per le proprie esigenze tramite la messa a punto immediata del modello dall'API o da Tuning Studio. Un foundation model tempestivamente sintonizzato si basa sul foundation model sottostante IBM. Si pagano le risorse consumate per mettere a punto il modello. Dopo la messa a punto del modello, si paga con i gettoni utilizzati per l'inferenza del modello. Vedere Modelli di fondazione sintonizzati con il prompt.

Se si desidera implementare i modelli di fondazione nel proprio centro dati, è possibile acquistare il software watsonx.ai Per ulteriori informazioni, vedere Panoramica di IBM watsonx as a Service e del software IBM watsonx.governance

Confronto tra i metodi di distribuzione

Per aiutarvi a scegliere il metodo di distribuzione giusto, consultate la tabella di confronto.

Tabella 1. Metodi di distribuzione del modello di fondazione
Tipo di distribuzione Disponibile da Meccanismo di distribuzione ambiente host Metodo di fatturazione Politica di deprezzamento
Modelli di fondazione forniti con watsonx.ai - Hub delle risorse>Pay per token
- Prompt Lab
Curato e distribuito da IBM Hardware multitenant Per gettoni utilizzati Deprecato in base al ciclo di vita pubblicato
Implementazione di modelli di fondazione on demand - Hub delle risorse>Pagare a ore
- Prompt Lab
Curato e distribuito da IBM su richiesta del cliente Hardware dedicato Per ora distribuito Il modello distribuito non è deprecato
Modelli di base personalizzati • Prompt Lab Curato e distribuito da voi Hardware dedicato Per ora distribuito Non deprecato
Modelli di fondazione sintonizzati su richiesta • Prompt Lab Sintonizzati e distribuiti da voi Hardware multitenant - La formazione è fatturata con il
CUH - L'inferenza è fatturata con i token utilizzati
Deprecato quando il modello sottostante è deprecato, a meno che non si aggiunga il modello sottostante come foundation model personalizzato

Per i dettagli su come vengono calcolati e monitorati i prezzi dei modelli, vedere Dettagli di fatturazione per gli asset di IA generativa.

Modelli di fondazione supportati per metodo di distribuzione

watsonx.ai mette a disposizione diversi modelli di fondazione che possono essere utilizzati immediatamente o che possono essere distribuiti su hardware dedicato per l'uso da parte dell'organizzazione.

Tabella 1a. Modelli di fondazione disponibili per metodo di distribuzione
di servizi Fornito con watsonx.ai
(Pay per token)
Distribuzione su richiesta
(pagamento a ore)
IBM - granite-13b-chat-v2 (Deprecato)
- granite-13b-instruct-v2
- granite-7b-lab (Deprecato)
- granite-8b-japanese
- granite-3-8b-base
- granite-20b-multilingual
- granite-3-2b-instruct
- granite-3-8b-instruct
- granite-guardian-3-2b
- granite-guardian-3-8b
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
granite-13b-chat-v2
granite-13b-instruct-v2
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Google flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
Meta - llama-3-3-70b-instruct
- llama-3-2-1b-instruct
- llama-3-2-3b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct
- llama-guard-3-11b-vision-instruct
- llama-3-1-8b-instruct
- llama-3-1-70b-instruct
- llama-3-405b-instruct
- llama-3-8b-instruct (deprecata)
- llama-3-70b-instruct (deprecata)
- llama-2-13b-chat (deprecata)
- llama-3-3-70b-instruct
- llama-3-3-70b-instruct-hf
- llama-2-13b-chat
- llama-2-70b-chat
- llama-3-8b-instruct
- llama-3-70b-instruct
- llama-3-1-8b
- llama-3-1-8b-instruct
Mistral AI mistral-large
mixtral-8x7b-instruct-v01
pixtral-12b
mixtral-8x7b-base
mixtral-8x7b-instruct-v01
mistral-nemo-instruct-2407
BigScience mt0-xxl-13b mt0-xxl-13b
Code Llama codellama-34b-instruct
ELYZA, Inc elyza-japanese-llama-2-7b-instruct
Inception jais-13b-chat
SDAIA allam-1-13b-instruct

Modelli di fondazione forniti con watsonx.ai

Una raccolta di modelli open source e IBM foundation vengono distribuiti in IBM watsonx.ai. È possibile richiedere questi modelli di fondazione nel Prompt Lab o in modo programmatico.

Modelli di fondazione IBM forniti con watsonx.ai

La seguente tabella elenca i modelli di fondazione IBM supportati che IBM fornisce per l'inferenza.

L'uso è misurato in unità di risorse (RU); ogni unità equivale a 1.000 gettoni dell'input e dell'output dell'inferenza foundation model. Per maggiori dettagli sulle modalità di calcolo e monitoraggio dei prezzi dei modelli, consultare la sezione Dettagli di fatturazione per gli asset di IA generativa.

Alcuni modelli di fondazione IBM sono disponibili anche in repository di terze parti, come Hugging Face. I modelli di fondazione IBM ottenuti da un repository di terze parti non sono indennizzati da IBM. Solo i modelli di fondazione IBM a cui si accede da watsonx.ai sono indennizzati da IBM. Per ulteriori informazioni sulle tutele contrattuali relative all'indennizzo IBM, consultare il Contratto di collaborazione con il cliente IBM e la descrizione del servizio IBM watsonx.ai

Tabella 2. Modelli di fondazione IBM forniti con watsonx.ai
Nome modello Prezzo di
USD/1,000 gettoni)
Prezzo di
USD/1,000 gettoni)
Finestra contestuale
(token di ingresso e di uscita)
Ulteriori informazioni
granite-13b-chat-v2 $0.0006 $0.0006 8,192 - Scheda modello
- Sito web
- Documento di ricerca
granite-13b-instruct-v2 $0.0006 $0.0006 8,192 - Scheda modello
- Sito web
- Documento di ricerca
Nota: questo foundation model può essere messo a punto in modo tempestivo.
granite-7b-lab $0.0006 $0.0006 8,192 - Scheda modello
- Carta di ricerca (LAB)
granite-8b-japanese $0.0006 $0.0006 4.096 - Scheda modello
- Sito web
- Documento di ricerca
granite-20b-multilingual $0.0006 $0.0006 8,192 - Scheda modello
- Sito web
- Documento di ricerca
granite-3-2b-instruct $0.0001 $0.0001 131,072 - Scheda modello
- Sito web
- Documento di ricerca
granite-3-8b-instruct $0.0002 $0.0002 131,072 - Scheda modello
- Sito web
- Documento di ricerca
granite-guardian-3-2b $0.0001 $0.0001 8,192 - Scheda modello
- Sito web
granite-guardian-3-8b $0.0002 $0.0002 8,192 - Scheda modello
- Sito web
granite-3b-code-instruct $0.0006 $0.0006 128.000 - Scheda modello
- Sito web
- Documento di ricerca
granite-8b-code-instruct $0.0006 $0.0006 128.000 - Scheda modello
- Sito web
- Documento di ricerca
granite-20b-code-instruct $0.0006 $0.0006 8,192 - Scheda modello
- Sito web
- Documento di ricerca
granite-34b-code-instruct $0.0006 $0.0006 8,192 - Scheda modello
- Sito web
- Documento di ricerca

 

Modelli di fondazione di terze parti forniti con watsonx.ai

La seguente tabella elenca i modelli di fondazione di terze parti supportati e forniti con watsonx.ai

L'uso è misurato in unità di risorse (RU); ogni unità equivale a 1.000 gettoni dell'input e dell'output dell'inferenza foundation model. Per maggiori dettagli sulle modalità di calcolo e monitoraggio dei prezzi dei modelli, consultare la sezione Dettagli di fatturazione per gli asset di IA generativa.

Tabella 3. Modelli di fondazione di terze parti forniti con watsonx.ai
Nome modello di servizi Prezzo di
USD/1,000 gettoni)
Prezzo di
USD/1,000 gettoni)
Finestra contestuale
(token di ingresso e di uscita)
Ulteriori informazioni
allam-1-13b-instruct Centro nazionale per l'intelligenza artificiale e autorità saudita per i dati e l'intelligenza artificiale $0.0018 $0.0018 4.096 - Scheda modello
codellama-34b-instruct Code Llama $0.0018 $0.0018 16.384 - Scheda modello
- 'Meta Blog AI
elyza-japanese-llama-2-7b-instruct ELYZA, Inc $0.0018 $0.0018 4.096 - Scheda modello
- Blog su note.com
flan-t5-xl-3b Google $0.0006 $0.0006 4.096 - Scheda modello
- Carta di ricerca
Nota: questo foundation model può essere messo a punto in modo tempestivo.
flan-t5-xxl-11b Google $0.0018 $0.0018 4.096 - Scheda modello
" - Carta di ricerca
flan-ul2-20b Google $0.0050 $0.0050 4.096 - Scheda modello
- Carta di ricercaUL2
- Carta di ricerca Flan
jais-13b-chat Introduzione, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) e Cerebras Systems $0.0018 $0.0018 2,048 - Scheda modello
" - Carta di ricerca
llama-3-3-70b-instruct Meta $0.0018 $0.0018 131,072 - Scheda modello
- 'Meta AI blog
llama-3-2-1b-instruct Meta $0.0001 $0.0001 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-3-2-3b-instruct Meta $0.00015 $0.00015 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-3-2-11b-vision-instruct Meta $0.00035 $0.00035 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-3-2-90b-vision-instruct Meta $0.0020 $0.0020 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-guard-3-11b-vision Meta $0.00035 $0.00035 131,072 - Scheda modello
- 'Meta AI blog
- Carta di ricerca
llama-3-1-8b-instruct Meta $0.0006 $0.0006 131,072 - Scheda modello
- 'Meta AI blog
llama-3-1-70b-instruct Meta $0.0018 $0.0018 131,072 - Scheda modello
- 'Meta AI blog
llama-3-405b-instruct Meta $0.0050 $0.016 16.384 - Scheda modello
- 'Meta AI blog
llama-3-8b-instruct Meta $0.0006 $0.0006 8,192 - Scheda modello
- 'Meta AI blog
llama-3-70b-instruct Meta $0.0018 $0.0018 8,192 - Scheda modello
- 'Meta AI blog
llama-2-13b-chat Meta $0.0006 $0.0006 4.096 - Scheda modello
" - Carta di ricerca
mistral-large Mistral AI $0.003 $0.01 32.768 - Scheda modello
- Post sul blog per Mistral Large 2
mixtral-8x7b-instruct-v01 Mistral AI $0.0006 $0.0006 32.768 - Scheda modello
" - Carta di ricerca
mt0-xxl-13b BigScience $0.0018 $0.0018 4.096 - Scheda modello
" - Carta di ricerca
pixtral-12b Mistral AI $0.00035 $0.00035 128.000 - Scheda modello
- Blog post per Pixtral 12B

 

Modelli di base personalizzati

Oltre a lavorare con i modelli di fondazione curati da IBM, è possibile caricare e distribuire i propri modelli di fondazione. Dopo che i modelli personalizzati sono stati distribuiti e registrati con watsonx.ai, è possibile creare prompt che fanno riferimento ai modelli personalizzati dal Prompt Lab e dall'API di watsonx.ai.

Per ulteriori informazioni su come caricare, registrare e distribuire un foundation model personalizzato, vedere Distribuzione di un foundation model personalizzato.

Implementazione di modelli di fondazione on demand

Scegliete un foundation model da una serie di modelli IBM da distribuire per l'uso esclusivo della vostra organizzazione.

Per ulteriori informazioni su come distribuire un foundation model su richiesta, vedere Distribuzione di modelli di fondazione su richiesta.

Nota: i modelli di Fondazione che si possono distribuire su richiesta sono disponibili solo nel data center di Dallas.

Implementazione dei modelli di fondazione on demand di IBM

La seguente tabella elenca i modelli di fondazione IBM disponibili per la distribuzione su richiesta.

Alcuni modelli di fondazione IBM sono disponibili anche in repository di terze parti, come Hugging Face. I modelli di fondazione IBM ottenuti da un repository di terze parti non sono indennizzati da IBM. Solo i modelli di fondazione IBM a cui si accede da watsonx.ai sono indennizzati da IBM. Per ulteriori informazioni sulle tutele contrattuali relative all'indennizzo IBM, consultare il Contratto di collaborazione con il cliente IBM e la descrizione del servizio IBM watsonx.ai

Tabella 4. Modelli di fondazione IBM disponibili per l'implementazione on demand in watsonx.ai
Nome modello Prezzo all'ora in USD Categoria di hosting del modello Finestra contestuale
(token di ingresso e di uscita)
granite-13b-chat-v2 $5.22 Piccolo 8,192
granite-13b-instruct-v2 $5.22 Piccolo 8,192
granite-20b-code-base-schema-linking $5.22 Piccolo 8,192
granite-20b-code-base-sql-gen $5.22 Piccolo 8,192
granite-3-8b-base $5.22 Piccolo 4.096

 

Distribuire modelli di fondazione on demand da terze parti

La tabella seguente elenca i modelli di fondazione di terze parti disponibili per la distribuzione su richiesta.

Tabella 5. Modelli di fondazione di terze parti disponibili per l'implementazione su richiesta in watsonx.ai
Nome modello di servizi Prezzo all'ora in USD Categoria di hosting del modello Finestra contestuale
(token di ingresso e di uscita)
flan-t5-xl-3b Google $5.22 Piccolo 4.096
flan-t5-xxl-11b Google $5.22 Piccolo 4.096
flan-ul2-20b Google $5.22 Piccolo 4.096
llama-2-13b-chat Meta $5.22 Piccolo 4.096
llama-2-70b-chat Meta $20.85 Grande 4.096
llama-3-8b-instruct Meta $5.22 Piccolo 8,192
llama-3-70b-instruct Meta $20.85 Grande 8,192
llama-3-1-8b Meta $5.22 Piccolo 131,072
llama-3-1-8b-instruct Meta $5.22 Piccolo 131,072
llama-3-3-70b-instruct Meta $10.40 Medio 8,192
llama-3-3-70b-instruct-hf Meta $20.85 Grande 8,192
mixtral-8x7b-base Mistral AI $10.40 Medio 32.768
mixtral-8x7b-instruct-v01 Mistral AI $10.40 Medio 32.768
mistral-nemo-instruct-2407 Mistral AI $5.22 Piccolo 131,072
mt0-xxl-13b BigScience $5.22 Piccolo 4.096

 

Modelli di fondazione sintonizzati su richiesta

È possibile personalizzare i seguenti modelli di fondazione mediante una rapida messa a punto in watsonx.ai:

Per ulteriori informazioni, vedere Tuning Studio.

Ulteriori informazioni

Argomento principale: Sviluppo di soluzioni AI generative

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni