Modèles de fondation pris en charge dans watsonx.ai
Vous pouvez travailler avec des modèles tiers et des modèles de base d' IBM, disponibles sur IBM watsonx.ai. Vous pouvez utiliser les modèles de base fournis par IBM et prêts à l'emploi, ou déployer des modèles de base à la demande pour une utilisation exclusive au sein de votre organisation.
Comment choisir un modèle
Pour passer en revue les facteurs qui peuvent vous aider à choisir un modèle, tels que les tâches et les langues prises en charge, consultez les sections Choisir un modèle et Benchmarks des modèles Foundation.
Modèles de fondation par méthode de déploiement
Selon la méthode de déploiement, vous pouvez utiliser les modèles de base directement sur du matériel multi-locataires ou déployer des modèles sur du matériel dédié à l'usage de votre organisation. Pour en savoir plus sur les différentes méthodes de déploiement des modèles, consultez Méthodes de déploiement des modèles Foundation.
Fourniture de modèles de fond de teint prêts à l'emploi
Une collection de modèles de base open source et IBM sont déployés dans IBM watsonx.ai. Vous pouvez demander ces modèles de fondation dans le Prompt Lab ou par programme.
IBM modèles de fondations
Le tableau suivant répertorie les modèles de base IBM pris en charge par IBM pour l'inférence.
L'utilisation est mesurée en unités de ressources (UR); chaque unité équivaut à 1 000 jetons provenant de l'entrée et de la sortie de l'inférence du modèle de base. Pour plus d'informations sur le calcul et le suivi de la tarification des modèles, voir les détails de la facturation des actifs d'IA générative.
Vous pouvez également accéder à certains modèles de base d' IBM s à partir de référentiels tiers, tels que Hugging Face. Les modèles IBM Foundation que vous obtenez à partir d'un référentiel tiers ne sont pas indemnisés par IBM. Seuls les modèles de fondation IBM auxquels vous accédez à partir de watsonx.ai sont indemnisés par IBM Pour plus d'informations sur les protections contractuelles liées à l'indemnisation d' IBM, voir le contrat de relation client IBM et la description du service IBM watsonx.ai
Nom du modèle | Identifiant du modèle API | Prix d entrée*USD/1,000 jetons) |
Prix sortie*USD/1,000 jetons) |
Fenêtre contextuelle (jetons d'entrée et de sortie) |
Informations complémentaires |
---|---|---|---|---|---|
granite-3-3-8b-instruct | ibm/granite-3-3-8b-instruct |
$0.0002 | $0.0002 | 131 072 | - Carte modèle - Site web |
granite-13b-instruct-v2 | ibm/granite-13b-instruct-v2 |
$0.0006 | $0.0006 | 8 192 | - Carte modèle - Site web - Document de recherche Remarque : ce modèle de fondation peut être rapidement ajusté.
|
granite-8b-japanese | ibm/granite-8b-japanese |
$0.0006 | $0.0006 | 4,096 | - Carte modèle - Site web - Document de recherche |
granite-3-2b-instruct | ibm/granite-3-2b-instruct |
$0.0001 | $0.0001 | 131 072 | - Carte modèle - Site web - Document de recherche |
granite-3-8b-instruct | ibm/granite-3-8b-instruct |
$0.0002 | $0.0002 | 131 072 | - Carte modèle - Site web - Document de recherche |
granite-3-2-8b-instruct | ibm/granite-3-2-8b-instruct |
$0.0002 | $0.0002 | 131 072 | - Carte modèle - Site web - Document de recherche |
granite-guardian-3-2b | ibm/granite-guardian-3-2b |
$0.0001 | $0.0001 | 131 072 | - Modèle de carte - Site web |
granite-guardian-3-8b | ibm/granite-guardian-3-8b |
$0.0002 | $0.0002 | 131 072 | - Modèle de carte - Site web |
granite-3b-code-instruct | ibm/granite-3b-code-instruct |
$0.0006 | $0.0006 | 128,000 | - Carte modèle - Site web - Document de recherche |
granite-8b-code-instruct | ibm/granite-8b-code-instruct |
$0.0006 | $0.0006 | 128,000 | - Carte modèle - Site web - Document de recherche |
granite-20b-code-instruct | ibm/granite-20b-code-instruct |
$0.0006 | $0.0006 | 8 192 | - Carte modèle - Site web - Document de recherche |
granite-34b-code-instruct | ibm/granite-34b-code-instruct |
$0.0006 | $0.0006 | 8 192 | - Carte modèle - Site web - Document de recherche |
granite-vision-3-2-2b | ibm/granite-vision-3-2-2b |
$0.0001 | $0.0001 | 131 072 | - Carte modèle - Site web - Document de recherche |
Nom du modèle | Identifiant du modèle API | Prix des intrants ( USD/1,000 points de données) |
Prix à la production ( USD/1,000 points de données) |
Longueur du contexte Points de données minimum |
Informations complémentaires |
---|---|---|---|---|---|
granite-ttm-512-96-r2 | ibm/granite-ttm-512-96-r2 |
$0.00013 | $0.00038 | 512 | - Carte modèle - Site web - Document de recherche |
granite-ttm-1024-96-r2 | ibm/granite-ttm-1024-96-r2 |
$0.00013 | $0.00038 | 1 024 | - Carte modèle - Site web - Document de recherche |
granite-ttm-1536-96-r2 | ibm/granite-ttm-1536-96-r2 |
$0.00013 | $0.00038 | 1 536 | - Carte modèle - Site web - Document de recherche |
Modèles de fondations tierces
Le tableau suivant répertorie les modèles de fondation tiers pris en charge qui sont fournis avec watsonx.ai
L'utilisation est mesurée en unités de ressources (UR); chaque unité équivaut à 1 000 jetons provenant de l'entrée et de la sortie de l'inférence du modèle de base. Pour plus d'informations sur le calcul et le suivi de la tarification des modèles, voir les détails de la facturation des actifs d'IA générative.
Nom du modèle | Identifiant du modèle API | Fournisseur | Prix d entrée*USD/1,000 jetons) |
Prix sortie*USD/1,000 jetons) |
Fenêtre contextuelle (jetons d'entrée et de sortie) |
Informations complémentaires |
---|---|---|---|---|---|---|
allam-1-13b-instruct | sdaia/allam-1-13b-instruct |
National Center for Artificial Intelligence et Saudi Authority for Data and Artificial Intelligence | $0.0018 | $0.0018 | 4,096 | - Carte modèle |
elyza-japanese-llama-2-7b-instruct | elyza/elyza-japanese-llama-2-7b-instruct |
ELYZA, Inc | $0.0018 | $0.0018 | 4,096 | - Modèle de carte - Blog sur note.com |
flan-t5-xl-3b | google/flan-t5-xl |
$0.0006 | $0.0006 | 4,096 | - Carte modèle - Document de recherche Remarque : ce modèle de fondation peut être rapidement ajusté.
|
|
flan-t5-xxl-11b | google/flan-t5-xxl |
$0.0018 | $0.0018 | 4,096 | - Modèle de carte - Document de recherche |
|
flan-ul2-20b | google/flan-ul2 |
$0.0050 | $0.0050 | 4,096 | - Carte modèle - Document de rechercheUL2 - Document de recherche Flan |
|
jais-13b-chat | core42/jais-13b-chat |
Création, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI), et Cerebras Systems | $0.0018 | $0.0018 | 2,048 | - Modèle de carte - Document de recherche |
llama-4-maverick-17b-128e-instruct-fp8 | meta-llama/llama-4-maverick-17b-128e-instruct-fp |
Meta | $0.00035 | $0.0014 | 131 072 | - Modèle de carte - " Meta AI blog |
llama-4-scout-17b-16e-instruct |
meta-llama/llama-4-scout-17b-16e-instruct |
Meta | Gratuit pendant l'avant-première | Gratuit pendant l'avant-première | 131 072 | - Modèle de carte - " Meta AI blog |
llama-3-3-70b-instruct | meta-llama/llama-3-3-70b-instruct |
Meta | $0.00071 | $0.00071 | 131 072 | - Modèle de carte - " Meta AI blog |
llama-3-2-1b-instruct | meta-llama/llama-3-2-1b-instruct |
Meta | $0.0001 | $0.0001 | 131 072 | - Carte modèle - " Meta AI blog - Document de recherche |
llama-3-2-3b-instruct | meta-llama/llama-3-2-3b-instruct |
Meta | $0.00015 | $0.00015 | 131 072 | - Carte modèle - " Meta AI blog - Document de recherche |
llama-3-2-11b-vision-instruct | meta-llama/llama-3-2-11b-vision-instruct |
Meta | $0.00035 | $0.00035 | 131 072 | - Carte modèle - " Meta AI blog - Document de recherche |
llama-3-2-90b-vision-instruct | meta-llama/llama-3-2-90b-vision-instruct |
Meta | $0.0020 | $0.0020 | 131 072 | - Carte modèle - " Meta AI blog - Document de recherche |
llama-guard-3-11b-vision | meta-llama/llama-guard-3-11b-vision |
Meta | $0.00035 | $0.00035 | 131 072 | - Carte modèle - " Meta AI blog - Document de recherche |
llama-3-1-8b-instruct | meta-llama/llama-3-1-8b-instruct |
Meta | $0.0006 | $0.0006 | 131 072 | - Modèle de carte - " Meta AI blog |
llama-3-1-70b-instruct | meta-llama/llama-3-1-70b-instruct |
Meta | $0.0018 | $0.0018 | 131 072 | - Modèle de carte - " Meta AI blog |
llama-3-405b-instruct | meta-llama/llama-3-405b-instruct |
Meta | $0.0050 | $0.016 | 16 384 | - Modèle de carte - " Meta AI blog |
llama-2-13b-chat | meta-llama/llama-2-13b-chat |
Meta | $0.0006 | $0.0006 | 4,096 | - Modèle de carte - Document de recherche |
mistral-large | mistralai/mistral-large |
Mistral AI | $0.003 | $0.01 | 131 072 | - Carte modèle - Blog post pour Mistral Large 2 |
mistral-medium-2505 | mistralai/mistral-medium-2505 |
Mistral AI | Gratuit pendant l'avant-première | Gratuit pendant l'avant-première | 131 072 | - Carte modèle - Blog post pour Mistral Medium 3 |
mistral-small-3-1-24b-instruct-2503 | mistralai/mistral-small-3-1-24b-instruct-2503 |
Mistral AI | $0.0001 | $0.0003 | 131 072 | • Carte modèle • Article de blog pour Mistral 3.1 |
mistral-small-24b-instruct-2501 | mistralai/mistral-small-24b-instruct-2501 |
Mistral AI | $0.00035 | $0.00035 | 32 768 | - Carte modèle - Blog post pour Mistral Small 3 |
mixtral-8x7b-instruct-v01 | mistralai/mixtral-8x7b-instruct-v01 |
Mistral AI | $0.0006 | $0.0006 | 32 768 | - Modèle de carte - Document de recherche |
mt0-xxl-13b | bigscience/mt0-xxl |
BigScience | $0.0018 | $0.0018 | 4,096 | - Modèle de carte - Document de recherche |
pixtral-12b | mistralai/pixtral-12b |
Mistral AI | $0.00035 | $0.00035 | 128,000 | - Carte modèle - Blog post pour Pixtral 12B |
Déployer des modèles de fondation à la demande
Vous pouvez travailler avec un modèle de base parmi un ensemble de modèles gérés par l' IBM, à déployer pour l'usage exclusif de votre organisation.
IBM déployer des modèles de fondation à la demande
Le tableau suivant répertorie les modèles de fondations d' IBM s que vous pouvez déployer à la demande.
Certains modèles de fondations d' IBM s sont également disponibles auprès de référentiels tiers, tels que Hugging Face. Les modèles IBM Foundation que vous obtenez à partir d'un référentiel tiers ne sont pas indemnisés par IBM. Seuls les modèles de fondation IBM auxquels vous accédez à partir de watsonx.ai sont indemnisés par IBM Pour plus d'informations sur les protections contractuelles liées à l'indemnisation d' IBM, voir le contrat de relation client IBM et la description du service IBM watsonx.ai
Nom du modèle | Prix par heure en USD | Catégorie d'hébergement de modèles | Fenêtre contextuelle (jetons d'entrée et de sortie) |
---|---|---|---|
granite-3-3-8b-instruct | $5.22 | Petit | 131 072 |
granite-3-3-2b-instruct | $5.22 | Petit | 131 072 |
granite-3-2-8b-instruct | $5.22 | Petit | 131 072 |
granite-3-1-8b-base | $5.22 | Petit | 131 072 |
granite-8b-japanese | $5.22 | Petit | 4,096 |
granite-20b-multilingual | $5.22 | Petit | 8 192 |
granite-13b-chat-v2 | $5.22 | Petit | 8 192 |
granite-13b-instruct-v2 | $5.22 | Petit | 8 192 |
granite-3b-code-instruct | $5.22 | Petit | 128,000 |
granite-8b-code-instruct | $5.22 | Petit | 128,000 |
granite-20b-code-instruct | $5.22 | Petit | 8 192 |
granite-34b-code-instruct | $5.22 | Petit | 8 192 |
granite-20b-code-base-schema-linking | $5.22 | Petit | 8 192 |
granite-20b-code-base-sql-gen | $5.22 | Petit | 8 192 |
granite-3-8b-base | $5.22 | Petit | 4,096 |
Déploiement par des tiers de modèles de base à la demande
Le tableau suivant répertorie les modèles de fondations tierces que vous pouvez déployer à la demande.
Nom du modèle | Fournisseur | Prix par heure en USD | Catégorie d'hébergement de modèles | Fenêtre contextuelle (jetons d'entrée et de sortie) |
---|---|---|---|---|
allam-1-13b-instruct | National Center for Artificial Intelligence et Saudi Authority for Data and Artificial Intelligence | $5.22 | Petit | 4,096 |
codellama-34b-instruct-hf | Code Llama | $10.40 | Moyen | 16 384 |
deepseek-r1-distill-llama-8b | DeepSeek AI | $5.22 | Petit | 131 072 |
deepseek-r1-distill-llama-70b | DeepSeek AI | $20.85 | Grand | 131 072 |
eurollm-1-7b-instruct | Un projet de grande envergure | $5.22 | Petit | 4,096 |
eurollm-9b-instruct | Un projet de grande envergure | $5.22 | Petit | 4,096 |
flan-t5-xl-3b | $5.22 | Petit | 4,096 | |
flan-t5-xxl-11b | $5.22 | Petit | 4,096 | |
flan-ul2-20b | $5.22 | Petit | 4,096 | |
llama-2-13b-chat | Meta | $5.22 | Petit | 4,096 |
llama-2-70b-chat | Meta | $20.85 | Grand | 4,096 |
llama-3-8b-instruct | Meta | $5.22 | Petit | 8 192 |
llama-3-70b-instruct | Meta | $20.85 | Grand | 8 192 |
llama-3-1-8b | Meta | $5.22 | Petit | 131 072 |
llama-3-1-70b | Meta | $20.85 | Grand | 131 072 |
llama-3-1-8b-instruct | Meta | $5.22 | Petit | 131 072 |
llama-3-1-70b-instruct | Meta | $20.85 | Grand | 131 072 |
llama-3-2-11b-vision-instruct | Meta | $5.22 | Petit | 131 072 |
llama-3-3-70b-instruct | Meta | $10.40 | Moyen | 131 072 |
llama-3-3-70b-instruct-hf | Meta | $20.85 | Grand | 131 072 |
mixtral-8x7b-base | Mistral AI | $10.40 | Moyen | 32 768 |
mixtral-8x7b-instruct-v01 | Mistral AI | $10.40 | Moyen | 32 768 |
mistral-large-instruct-2407 | Mistral AI | 55.15 (voir note) | Grand | 131 072 |
mistral-large-instruct-2411 | Mistral AI | 55.15 (voir note) | Grand | 131 072 |
mistral-nemo-instruct-2407 | Mistral AI | $5.22 | Petit | 131 072 |
mt0-xxl-13b | BigScience | $5.22 | Petit | 4,096 |
poro-34b-chat | LumiOpen | $10.40 | Moyen | 2,048 |
Hébergement : $ 20.85 + Accès : $ 34.30 = Total : $ 55.15 USD par heure
En savoir plus
- IBM modèles de fondations
- Modèles de fondations tierces
- Pour plus d'informations sur les modèles de fondation qu' IBM fournit pour l'intégration et le reclassement de texte, voir Modèles d'encodeur pris en charge.
- Pour obtenir la liste des modèles fournis dans chaque centre de données régional, consultez la rubrique Disponibilité régionale des modèles de base.
- Pour plus de détails sur la tarification du modèle de fondation, voir Détails de facturation pour les actifs IA génératifs.
- Pour plus d'informations sur la tarification et la limitation des tarifs, voir watsonx.ai Runtime plans.
Sujet parent : Solutions Gen AI