Modèles de fondation pris en charge dans watsonx.ai

Dernière mise à jour : 07 avr. 2025
Modèles de fondation pris en charge dans watsonx.ai

Vous pouvez travailler avec des modèles tiers et des modèles de base d' IBM, disponibles sur IBM watsonx.ai. Vous pouvez utiliser les modèles de base fournis par IBM et prêts à l'emploi, ou déployer des modèles de base à la demande pour une utilisation exclusive au sein de votre organisation.

Comment choisir un modèle

Pour passer en revue les facteurs qui peuvent vous aider à choisir un modèle, tels que les tâches et les langues prises en charge, consultez les sections Choisir un modèle et Benchmarks des modèles Foundation.

Modèles de fondation par méthode de déploiement

Selon la méthode de déploiement, vous pouvez utiliser les modèles de base directement sur du matériel multi-locataires ou déployer des modèles sur du matériel dédié à l'usage de votre organisation. Pour en savoir plus sur les différentes méthodes de déploiement des modèles, consultez Méthodes de déploiement des modèles Foundation.

Tableau 1. Modèles de fondation par méthode de déploiement
Fournisseur Fourni avec watsonx.ai
(Pay per token)
Déploiement à la demande
(paiement à l'heure)
IBM - granite-13b-instruct-v2
- granite-8b-japonais (Déclassé)
- granite-3-8b-base
- granite-20b-multilingual (Obsolète)
- granite-3-2b-instruct
- granite-3-8b-instruct
- granite-3-2-8b-instruct
- granite-guardian-3-2b
- granite-guardian-3-8b
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
- granite-vision-3-2-2b
granite-7b-lab
granite-8b-japanese
granite-13b-chat-v2
granite-13b-instruct-v2
granite-20b-multilingual
granite-3b-code-instruct
granite-8b-code-instruct
granite-20b-code-instruct
granite-34b-code-instruct
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Google flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
Meta - llama-4-maverick-17b-128e-instruct-fp8
- llama-4-scout-17b-16e-instruct
- llama-3-3-70b-instruct
- llama-3-2-1b-instruct
- llama-3-2-3b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct
- llama-guard-3-11b-vision-instruct
- llama-3-1-8b-instruct (Déclassé)
- llama-3-1-70b-instruct (Obsolète)
- llama-2-13b-chat (Obsolète)
- llama-3-3-70b-instruct
- llama-3-3-70b-instruct-hf
- llama-3-1-70b-instructions
- - llama-2-13b-chat
- llama-2-70b-chat
- llama-3-8b-instruct
- llama-3-70b-instruct
- llama-3-1-8b
- llama-3-1-8b-instruct
Mistral AI mistral-large
mistral-small-24b-instruct-2501
mixtral-8x7b-instruct-v01
pixtral-12b
mistral-large-instruct-2407
mistral-large-instruct-2411
mistral-nemo-instruct-2407
mixtral-8x7b-base
mixtral-8x7b-instruct-v01
BigScience mt0-xxl-13b
Code Llama codellama-34b-instruct-hf
DeepSeek AI - deepseek-r1-distill-llama-8b
- deepseek-r1-distill-llama-70b
ELYZA, Inc elyza-japanese-llama-2-7b-instruct
Inception jais-13b-chat
SDAIA allam-1-13b-instruct allam-1-13b-instruct
Projet de transcription et de traduction unifiées pour la réalité étendue (UTTER) - eurollm-1-7b-instruct
- eurollm-9b-instruct

Fourniture de modèles de fond de teint prêts à l'emploi

Une collection de modèles de base open source et IBM sont déployés dans IBM watsonx.ai. Vous pouvez demander ces modèles de fondation dans le Prompt Lab ou par programme.

IBM modèles de fondations

Le tableau suivant répertorie les modèles de base IBM pris en charge par IBM pour l'inférence.

L'utilisation est mesurée en unités de ressources (UR); chaque unité équivaut à 1 000 jetons provenant de l'entrée et de la sortie de l'inférence du modèle de base. Pour plus d'informations sur le calcul et le suivi de la tarification des modèles, voir les détails de la facturation des actifs d'IA générative.

Vous pouvez également accéder à certains modèles de base d' IBM s à partir de référentiels tiers, tels que Hugging Face. Les modèles IBM Foundation que vous obtenez à partir d'un référentiel tiers ne sont pas indemnisés par IBM. Seuls les modèles de fondation IBM auxquels vous accédez à partir de watsonx.ai sont indemnisés par IBM Pour plus d'informations sur les protections contractuelles liées à l'indemnisation d' IBM, voir le contrat de relation client IBM et la description du service IBM watsonx.ai

Tableau 2a. IBM modèles de base fournis avec l' watsonx.ai, pour l'inférence
Nom du modèle Identifiant du modèle API Prix d
entrée*USD/1,000 jetons)
Prix
sortie*USD/1,000 jetons)
Fenêtre contextuelle
(jetons d'entrée et de sortie)
Informations complémentaires
granite-13b-instruct-v2 ibm/granite-13b-instruct-v2 $0.0006 $0.0006 8 192 - Carte modèle
- Site web
- Document de recherche
Remarque : ce modèle de fondation peut être rapidement ajusté.
granite-8b-japanese ibm/granite-8b-japanese $0.0006 $0.0006 4,096 - Carte modèle
- Site web
- Document de recherche
granite-20b-multilingual ibm/granite-20b-multilingual $0.0006 $0.0006 8 192 - Carte modèle
- Site web
- Document de recherche
granite-3-2b-instruct ibm/granite-3-2b-instruct $0.0001 $0.0001 131 072 - Carte modèle
- Site web
- Document de recherche
granite-3-8b-instruct ibm/granite-3-8b-instruct $0.0002 $0.0002 131 072 - Carte modèle
- Site web
- Document de recherche
granite-3-2-8b-instruct ibm/granite-3-2-8b-instruct $0.0002 $0.0002 131 072 - Carte modèle
- Site web
- Document de recherche
granite-guardian-3-2b ibm/granite-guardian-3-2b $0.0001 $0.0001 131 072 - Modèle de carte
- Site web
granite-guardian-3-8b ibm/granite-guardian-3-8b $0.0002 $0.0002 131 072 - Modèle de carte
- Site web
granite-3b-code-instruct ibm/granite-3b-code-instruct $0.0006 $0.0006 128,000 - Carte modèle
- Site web
- Document de recherche
granite-8b-code-instruct ibm/granite-8b-code-instruct $0.0006 $0.0006 128,000 - Carte modèle
- Site web
- Document de recherche
granite-20b-code-instruct ibm/granite-20b-code-instruct $0.0006 $0.0006 8 192 - Carte modèle
- Site web
- Document de recherche
granite-34b-code-instruct ibm/granite-34b-code-instruct $0.0006 $0.0006 8 192 - Carte modèle
- Site web
- Document de recherche
granite-vision-3-2-2b ibm/granite-vision-3-2-2b $0.0001 $0.0001 131 072 - Carte modèle
- Site web
- Document de recherche

 

Tableau 2b. IBM les modèles de fondation fournis à l'adresse watsonx.ai pour la prévision des valeurs futures
Nom du modèle Identifiant du modèle API Prix des intrants
( USD/1,000 points de données)
Prix à la production
( USD/1,000 points de données)
Longueur du contexte
Points de données minimum
Informations complémentaires
granite-ttm-512-96-r2 ibm/granite-ttm-512-96-r2 $0.00013 $0.00038 512 - Carte modèle
- Site web
- Document de recherche
granite-ttm-1024-96-r2 ibm/granite-ttm-1024-96-r2 $0.00013 $0.00038 1 024 - Carte modèle
- Site web
- Document de recherche
granite-ttm-1536-96-r2 ibm/granite-ttm-1536-96-r2 $0.00013 $0.00038 1 536 - Carte modèle
- Site web
- Document de recherche

 

Modèles de fondations tierces

Le tableau suivant répertorie les modèles de fondation tiers pris en charge qui sont fournis avec watsonx.ai

L'utilisation est mesurée en unités de ressources (UR); chaque unité équivaut à 1 000 jetons provenant de l'entrée et de la sortie de l'inférence du modèle de base. Pour plus d'informations sur le calcul et le suivi de la tarification des modèles, voir les détails de la facturation des actifs d'IA générative.

Tableau 3. Modèles de fondations tierces fournis avec watsonx.ai
Nom du modèle Identifiant du modèle API Fournisseur Prix d
entrée*USD/1,000 jetons)
Prix
sortie*USD/1,000 jetons)
Fenêtre contextuelle
(jetons d'entrée et de sortie)
Informations complémentaires
allam-1-13b-instruct sdaia/allam-1-13b-instruct National Center for Artificial Intelligence et Saudi Authority for Data and Artificial Intelligence $0.0018 $0.0018 4,096 - Carte modèle
elyza-japanese-llama-2-7b-instruct elyza/elyza-japanese-llama-2-7b-instruct ELYZA, Inc $0.0018 $0.0018 4,096 - Modèle de carte
- Blog sur note.com
flan-t5-xl-3b google/flan-t5-xl Google $0.0006 $0.0006 4,096 - Carte modèle
- Document de recherche
Remarque : ce modèle de fondation peut être rapidement ajusté.
flan-t5-xxl-11b google/flan-t5-xxl Google $0.0018 $0.0018 4,096 - Modèle de carte
- Document de recherche
flan-ul2-20b google/flan-ul2 Google $0.0050 $0.0050 4,096 - Carte modèle
- Document de rechercheUL2
- Document de recherche Flan
jais-13b-chat core42/jais-13b-chat Création, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI), et Cerebras Systems $0.0018 $0.0018 2,048 - Modèle de carte
- Document de recherche
llama-4-maverick-17b-128e-instruct-fp8 meta-llama/llama-4-maverick-17b-128e-instruct-fp Meta Gratuit pendant l'avant-première Gratuit pendant l'avant-première 131 072 - Modèle de carte
- " Meta AI blog
llama-4-scout-17b-16e-instruct meta-llama/llama-4-scout-17b-16e-instruct Meta Gratuit pendant l'avant-première Gratuit pendant l'avant-première 131 072 - Modèle de carte
- " Meta AI blog
llama-3-3-70b-instruct meta-llama/llama-3-3-70b-instruct Meta $0.00071 $0.00071 131 072 - Modèle de carte
- " Meta AI blog
llama-3-2-1b-instruct meta-llama/llama-3-2-1b-instruct Meta $0.0001 $0.0001 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-3-2-3b-instruct meta-llama/llama-3-2-3b-instruct Meta $0.00015 $0.00015 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-3-2-11b-vision-instruct meta-llama/llama-3-2-11b-vision-instruct Meta $0.00035 $0.00035 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-3-2-90b-vision-instruct meta-llama/llama-3-2-90b-vision-instruct Meta $0.0020 $0.0020 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-guard-3-11b-vision meta-llama/llama-guard-3-11b-vision Meta $0.00035 $0.00035 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-3-1-8b-instruct meta-llama/llama-3-1-8b-instruct Meta $0.0006 $0.0006 131 072 - Modèle de carte
- " Meta AI blog
llama-3-1-70b-instruct meta-llama/llama-3-1-70b-instruct Meta $0.0018 $0.0018 131 072 - Modèle de carte
- " Meta AI blog
llama-3-405b-instruct meta-llama/llama-3-405b-instruct Meta $0.0050 $0.016 16 384 - Modèle de carte
- " Meta AI blog
llama-2-13b-chat meta-llama/llama-2-13b-chat Meta $0.0006 $0.0006 4,096 - Modèle de carte
- Document de recherche
mistral-large mistralai/mistral-large Mistral AI $0.003 $0.01 131 072 - Carte modèle
- Blog post pour Mistral Large 2
mistral-small-24b-instruct-2501 mistralai/mistral-small-24b-instruct-2501 Mistral AI $0.00035 $0.00035 32 768 - Carte modèle
- Blog post pour Mistral Small 3
mixtral-8x7b-instruct-v01 mistralai/mixtral-8x7b-instruct-v01 Mistral AI $0.0006 $0.0006 32 768 - Modèle de carte
- Document de recherche
mt0-xxl-13b bigscience/mt0-xxl BigScience $0.0018 $0.0018 4,096 - Modèle de carte
- Document de recherche
pixtral-12b mistralai/pixtral-12b Mistral AI $0.00035 $0.00035 128,000 - Carte modèle
- Blog post pour Pixtral 12B

Déployer des modèles de fondation à la demande

Vous pouvez travailler avec un modèle de base parmi un ensemble de modèles gérés par l' IBM, à déployer pour l'usage exclusif de votre organisation.

IBM déployer des modèles de fondation à la demande

Le tableau suivant répertorie les modèles de fondations d' IBM s que vous pouvez déployer à la demande.

Certains modèles de fondations d' IBM s sont également disponibles auprès de référentiels tiers, tels que Hugging Face. Les modèles IBM Foundation que vous obtenez à partir d'un référentiel tiers ne sont pas indemnisés par IBM. Seuls les modèles de fondation IBM auxquels vous accédez à partir de watsonx.ai sont indemnisés par IBM Pour plus d'informations sur les protections contractuelles liées à l'indemnisation d' IBM, voir le contrat de relation client IBM et la description du service IBM watsonx.ai

Tableau 4. Les modèles de fondation IBM peuvent être déployés à la demande dans watsonx.ai
Nom du modèle Prix par heure en USD Catégorie d'hébergement de modèles Fenêtre contextuelle
(jetons d'entrée et de sortie)
granite-7b-lab $5.22 Petit 4,096
granite-8b-japanese $5.22 Petit 4,096
granite-20b-multilingual $5.22 Petit 8 192
granite-13b-chat-v2 $5.22 Petit 8 192
granite-13b-instruct-v2 $5.22 Petit 8 192
granite-3b-code-instruct $5.22 Petit 128,000
granite-8b-code-instruct $5.22 Petit 128,000
granite-20b-code-instruct $5.22 Petit 8 192
granite-34b-code-instruct $5.22 Petit 8 192
granite-20b-code-base-schema-linking $5.22 Petit 8 192
granite-20b-code-base-sql-gen $5.22 Petit 8 192
granite-3-8b-base $5.22 Petit 4,096

 

Déploiement par des tiers de modèles de base à la demande

Le tableau suivant répertorie les modèles de fondations tierces que vous pouvez déployer à la demande.

Tableau 5. Modèles de fondations tierces disponibles pour être déployés à la demande dans watsonx.ai
Nom du modèle Fournisseur Prix par heure en USD Catégorie d'hébergement de modèles Fenêtre contextuelle
(jetons d'entrée et de sortie)
allam-1-13b-instruct National Center for Artificial Intelligence et Saudi Authority for Data and Artificial Intelligence $5.22 Petit 4,096
codellama-34b-instruct-hf Code Llama $10.40 Moyen 16 384
deepseek-r1-distill-llama-8b DeepSeek AI $5.22 Petit 131 072
deepseek-r1-distill-llama-70b DeepSeek AI $20.85 Grand 131 072
eurollm-1-7b-instruct Un projet de grande envergure $5.22 Petit 4,096
eurollm-9b-instruct Un projet de grande envergure $5.22 Petit 4,096
flan-t5-xl-3b Google $5.22 Petit 4,096
flan-t5-xxl-11b Google $5.22 Petit 4,096
flan-ul2-20b Google $5.22 Petit 4,096
llama-2-13b-chat Meta $5.22 Petit 4,096
llama-2-70b-chat Meta $20.85 Grand 4,096
llama-3-8b-instruct Meta $5.22 Petit 8 192
llama-3-70b-instruct Meta $20.85 Grand 8 192
llama-3-1-8b Meta $5.22 Petit 131 072
llama-3-1-8b-instruct Meta $5.22 Petit 131 072
llama-3-1-70b-instruct Meta $20.85 Grand 131 072
llama-3-3-70b-instruct Meta $10.40 Moyen 131 072
llama-3-3-70b-instruct-hf Meta $20.85 Grand 131 072
mixtral-8x7b-base Mistral AI $10.40 Moyen 32 768
mixtral-8x7b-instruct-v01 Mistral AI $10.40 Moyen 32 768
mistral-large-instruct-2407 Mistral AI 55.15 (voir note) Grand 131 072
mistral-large-instruct-2411 Mistral AI 55.15 (voir note) Grand 131 072
mistral-nemo-instruct-2407 Mistral AI $5.22 Petit 131 072
mt0-xxl-13b BigScience $5.22 Petit 4,096

 

Remarque :L'hébergement des modèles de fondation mistral-large-instruct-2411 et mistral-large-instruct-2407 à partir de Mistral AI pour une utilisation dédiée est soumis à des frais d'accès horaires. Le prix total de l'hébergement de ces modèles de fondation déployés à la demande est la somme du prix d'accès et du prix d'hébergement.

Hébergement : $ 20.85 + Accès : $ 34.30 = Total : $ 55.15 USD par heure

En savoir plus

Sujet parent : Solutions Gen AI