0 / 0
Retourner à la version anglaise de la documentation
Modèles de fondation pris en charge dans watsonx.ai
Dernière mise à jour : 18 déc. 2024
Modèles de fondation pris en charge dans watsonx.ai

Une collection de modèles open source et IBM foundation sont disponibles pour l'inférence dans IBM watsonx.ai Trouvez les modèles de fondation qui répondent le mieux aux besoins de votre application d'IA générative et à votre budget.

Les modèles de fondation disponibles pour l'inférence à partir de watsonx.ai sont hébergés de différentes manières :

Modèles de fondation fournis avec watsonx.ai
Modèles de base IBM, déployés sur du matériel multitenant par IBM et disponibles pour l'inférence. Vous payez en fonction des jetons utilisés. Voir les modèles de fondation fournis avec watsonx.ai
Déployer des modèles de fondation à la demande
Une instance d'un foundation model IBM vous déployez et qui est dédié à votre utilisation de l'inférence. Seuls les collègues qui ont accès au déploiement peuvent déduire le foundation model. Un déploiement dédié signifie des interactions plus rapides et plus réactives sans limites de taux. Vous payez l'hébergement du foundation model à l'heure. Voir Déployer des modèles de fondation à la demande.
Modèles de fondation personnalisés
Modèles de fondation que vous avez créés et que vous importez et déployez dans watsonx.ai L'instance du foundation model personnalisé que vous déployez est réservée à votre usage. Un déploiement dédié signifie des interactions plus rapides et plus réactives. Vous payez l'hébergement du foundation model à l'heure. Voir Modèles de fondation personnalisés.
Modèles de fondations adaptés à la demande
Un sous-ensemble des modèles de fondation disponibles qui peuvent être personnalisés en fonction de vos besoins en ajustant rapidement le modèle à partir de l'API ou du Tuning Studio. Un foundation model à réglage rapide s'appuie sur le foundation model IBM Vous payez pour les ressources que vous consommez pour mettre au point le modèle. Une fois le modèle mis au point, vous payez en jetons utilisés pour inférer le modèle. Voir Modèles de fondations adaptés à la demande.

Si vous souhaitez déployer des modèles de fondation dans votre propre centre de données, vous pouvez acheter le logiciel watsonx.ai Pour plus d'informations, voir Présentation d' IBM watsonx as a Service et du logiciel IBM watsonx.governance

Comparaison des méthodes de déploiement

Pour vous aider à choisir la bonne méthode de déploiement, consultez le tableau comparatif.

Tableau 1. Méthodes de déploiement du modèle de fondation
Type de déploiement Disponible à partir du Mécanisme de déploiement environnement d'hébergement Méthode de facturation Politique de dépréciation
Modèles de fondation fournis avec watsonx.ai - Centre de ressources>Payer par jeton
- Prompt Lab
Créé et déployé par IBM Matériel multilocataire Par jetons utilisés Déclassé selon le cycle de vie publié
Déployer des modèles de fondation à la demande - Centre de ressources>Payer à l'heure
- Prompt Lab
Créé et déployé par IBM à votre demande Matériel dédié Par heure déployée Votre modèle déployé n'est pas obsolète
Modèles de fondation personnalisés • Prompt Lab Créée et déployée par vos soins Matériel dédié Par heure déployée Non déprécié
Modèles de fondations adaptés à la demande • Prompt Lab Réglé et déployé par vos soins Matériel multilocataire - La formation est facturée par le
" CUH - L'inférence est facturée par les jetons utilisés
Déclassé lorsque le modèle sous-jacent est déclassé à moins que vous n'ajoutiez le modèle sous-jacent en tant que foundation model personnalisé

Pour plus d'informations sur le calcul et le suivi de la tarification des modèles, voir les détails de la facturation pour les actifs d'IA générative.

Modèles de fondation pris en charge par méthode de déploiement

watsonx.ai propose différents modèles de fondation que vous pouvez utiliser immédiatement ou que vous pouvez déployer sur du matériel dédié à l'usage de votre organisation.

Tableau 1a. Modèles de fondation disponibles par méthode de déploiement
Fournisseur Fourni avec watsonx.ai
(Pay per token)
Déploiement à la demande
(paiement à l'heure)
IBM - granite-13b-chat-v2 (Obsolète)
- granite-13b-instruct-v2
- granite-7b-lab (Obsolète)
- granite-8b-japanese
- granite-3-8b-base
- granite-20b-multilingual
- granite-3-2b-instruct
- granite-3-8b-instruct
- granite-guardian-3-2b
- granite-guardian-3-8b
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
granite-13b-chat-v2
granite-13b-instruct-v2
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Google flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
Meta - llama-3-3-70b-instruct
- llama-3-2-1b-instruct
- llama-3-2-3b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct
- llama-guard-3-11b-vision-instruct
- llama-3-1-8b-instruct
- llama-3-1-70b-instruct
- llama-3-405b-instruct
- llama-3-8b-instruct (Obsolète)
- llama-3-70b-instruct (Obsolète)
- llama-2-13b-chat (Obsolète)
- llama-3-3-70b-instruct
- llama-3-3-70b-instruct-hf
- llama-2-13b-chat
- llama-2-70b-chat
- llama-3-8b-instruct
- llama-3-70b-instruct
- llama-3-1-8b
- llama-3-1-8b-instruct
Mistral AI mistral-large
mixtral-8x7b-instruct-v01
pixtral-12b
mixtral-8x7b-base
mixtral-8x7b-instruct-v01
mistral-nemo-instruct-2407
BigScience mt0-xxl-13b mt0-xxl-13b
Code Llama codellama-34b-instruct
ELYZA, Inc elyza-japanese-llama-2-7b-instruct
Inception jais-13b-chat
SDAIA allam-1-13b-instruct

Modèles de fondation fournis avec watsonx.ai

Une collection de modèles de base open source et IBM sont déployés dans IBM watsonx.ai. Vous pouvez demander ces modèles de fondation dans le Prompt Lab ou par programme.

Modèles de fondation IBM fournis avec watsonx.ai

Le tableau suivant répertorie les modèles de base IBM pris en charge par IBM pour l'inférence.

L'utilisation est mesurée en unités de ressources (UR) ; chaque unité est égale à 1 000 jetons provenant de l'entrée et de la sortie de l'inférence du foundation model. Pour plus d'informations sur le calcul et le suivi de la tarification des modèles, voir les détails de la facturation des actifs d'IA générative.

Certains modèles de la fondation IBM sont également disponibles dans des référentiels tiers, comme Hugging Face Les modèles IBM Foundation que vous obtenez à partir d'un référentiel tiers ne sont pas indemnisés par IBM. Seuls les modèles de fondation IBM auxquels vous accédez à partir de watsonx.ai sont indemnisés par IBM Pour plus d'informations sur les protections contractuelles liées à l'indemnisation d' IBM, voir le contrat de relation client IBM et la description du service IBM watsonx.ai

Tableau 2. Modèles de fondation IBM fournis avec watsonx.ai
Nom du modèle Prix d
entrée*USD/1,000 jetons)
Prix
sortie*USD/1,000 jetons)
Fenêtre contextuelle
(jetons d'entrée et de sortie)
Informations complémentaires
granite-13b-chat-v2 $0.0006 $0.0006 8 192 - Carte modèle
- Site web
- Document de recherche
granite-13b-instruct-v2 $0.0006 $0.0006 8 192 - Carte modèle
- Site web
- Document de recherche
Note : Ce foundation model peut être réglé rapidement.
granite-7b-lab $0.0006 $0.0006 8 192 - Carte modèle
- Document de recherche (LAB)
granite-8b-japanese $0.0006 $0.0006 4,096 - Carte modèle
- Site web
- Document de recherche
granite-20b-multilingual $0.0006 $0.0006 8 192 - Carte modèle
- Site web
- Document de recherche
granite-3-2b-instruct $0.0001 $0.0001 131 072 - Carte modèle
- Site web
- Document de recherche
granite-3-8b-instruct $0.0002 $0.0002 131 072 - Carte modèle
- Site web
- Document de recherche
granite-guardian-3-2b $0.0001 $0.0001 8 192 - Modèle de carte
- Site web
granite-guardian-3-8b $0.0002 $0.0002 8 192 - Modèle de carte
- Site web
granite-3b-code-instruct $0.0006 $0.0006 128,000 - Carte modèle
- Site web
- Document de recherche
granite-8b-code-instruct $0.0006 $0.0006 128,000 - Carte modèle
- Site web
- Document de recherche
granite-20b-code-instruct $0.0006 $0.0006 8 192 - Carte modèle
- Site web
- Document de recherche
granite-34b-code-instruct $0.0006 $0.0006 8 192 - Carte modèle
- Site web
- Document de recherche

 

Modèles de fondations tierces fournis avec watsonx.ai

Le tableau suivant répertorie les modèles de fondation tiers pris en charge qui sont fournis avec watsonx.ai

L'utilisation est mesurée en unités de ressources (UR) ; chaque unité est égale à 1 000 jetons provenant de l'entrée et de la sortie de l'inférence du foundation model. Pour plus d'informations sur le calcul et le suivi de la tarification des modèles, voir les détails de la facturation des actifs d'IA générative.

Tableau 3. Modèles de fondations tierces fournis avec watsonx.ai
Nom du modèle Fournisseur Prix d
entrée*USD/1,000 jetons)
Prix
sortie*USD/1,000 jetons)
Fenêtre contextuelle
(jetons d'entrée et de sortie)
Informations complémentaires
allam-1-13b-instruct National Center for Artificial Intelligence et Saudi Authority for Data and Artificial Intelligence $0.0018 $0.0018 4,096 - Carte modèle
codellama-34b-instruct Code Llama $0.0018 $0.0018 16 384 - Carte modèle
- " Meta AI Blog
elyza-japanese-llama-2-7b-instruct ELYZA, Inc $0.0018 $0.0018 4,096 - Modèle de carte
- Blog sur note.com
flan-t5-xl-3b Google $0.0006 $0.0006 4,096 - Carte modèle
- Document de recherche
Note : Ce foundation model peut être réglé rapidement.
flan-t5-xxl-11b Google $0.0018 $0.0018 4,096 - Modèle de carte
- Document de recherche
flan-ul2-20b Google $0.0050 $0.0050 4,096 - Carte modèle
- Document de rechercheUL2
- Document de recherche Flan
jais-13b-chat Création, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI), et Cerebras Systems $0.0018 $0.0018 2,048 - Modèle de carte
- Document de recherche
llama-3-3-70b-instruct Meta $0.0018 $0.0018 131 072 - Modèle de carte
- " Meta AI blog
llama-3-2-1b-instruct Meta $0.0001 $0.0001 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-3-2-3b-instruct Meta $0.00015 $0.00015 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-3-2-11b-vision-instruct Meta $0.00035 $0.00035 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-3-2-90b-vision-instruct Meta $0.0020 $0.0020 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-guard-3-11b-vision Meta $0.00035 $0.00035 131 072 - Carte modèle
- " Meta AI blog
- Document de recherche
llama-3-1-8b-instruct Meta $0.0006 $0.0006 131 072 - Modèle de carte
- " Meta AI blog
llama-3-1-70b-instruct Meta $0.0018 $0.0018 131 072 - Modèle de carte
- " Meta AI blog
llama-3-405b-instruct Meta $0.0050 $0.016 16 384 - Modèle de carte
- " Meta AI blog
llama-3-8b-instruct Meta $0.0006 $0.0006 8 192 - Modèle de carte
- " Meta AI blog
llama-3-70b-instruct Meta $0.0018 $0.0018 8 192 - Modèle de carte
- " Meta AI blog
llama-2-13b-chat Meta $0.0006 $0.0006 4,096 - Modèle de carte
- Document de recherche
mistral-large Mistral AI $0.003 $0.01 32 768 - Carte modèle
- Blog post pour Mistral Large 2
mixtral-8x7b-instruct-v01 Mistral AI $0.0006 $0.0006 32 768 - Modèle de carte
- Document de recherche
mt0-xxl-13b BigScience $0.0018 $0.0018 4,096 - Modèle de carte
- Document de recherche
pixtral-12b Mistral AI $0.00035 $0.00035 128,000 - Carte modèle
- Blog post pour Pixtral 12B

 

Modèles de fondation personnalisés

En plus de travailler avec des modèles de base créés par IBM, vous pouvez télécharger et déployer vos propres modèles de base. Une fois les modèles personnalisés déployés et enregistrés dans watsonx.ai, vous pouvez créer des invites qui infèrent les modèles personnalisés à partir du Prompt Lab et de l'API watsonx.ai

Pour en savoir plus sur le téléchargement, l'enregistrement et le déploiement d'un foundation model personnalisé, voir Déploiement d'un foundation model personnalisé.

Déployer des modèles de fondation à la demande

Choisissez un foundation model parmi un ensemble de modèles IBM et déployez-le pour l'usage exclusif de votre organisation.

Pour plus d'informations sur le déploiement d'un foundation model à la demande, voir Déploiement de modèles de fondation à la demande.

Remarque : les modèles de fondation que vous pouvez déployer à la demande ne sont disponibles que dans le centre de données de Dallas.

Déployer les modèles de fondation à la demande d'IBM

Le tableau suivant répertorie les modèles IBM Foundation que vous pouvez déployer à la demande.

Certains modèles de la fondation IBM sont également disponibles dans des référentiels tiers, comme Hugging Face Les modèles IBM Foundation que vous obtenez à partir d'un référentiel tiers ne sont pas indemnisés par IBM. Seuls les modèles de fondation IBM auxquels vous accédez à partir de watsonx.ai sont indemnisés par IBM Pour plus d'informations sur les protections contractuelles liées à l'indemnisation d' IBM, voir le contrat de relation client IBM et la description du service IBM watsonx.ai

Tableau 4. Les modèles de fondation IBM peuvent être déployés à la demande dans watsonx.ai
Nom du modèle Prix par heure en USD Catégorie d'hébergement de modèles Fenêtre contextuelle
(jetons d'entrée et de sortie)
granite-13b-chat-v2 $5.22 Petit 8 192
granite-13b-instruct-v2 $5.22 Petit 8 192
granite-20b-code-base-schema-linking $5.22 Petit 8 192
granite-20b-code-base-sql-gen $5.22 Petit 8 192
granite-3-8b-base $5.22 Petit 4,096

 

Déployer à la demande des modèles de fondation provenant de tiers

Le tableau suivant répertorie les modèles de fondations tierces que vous pouvez déployer à la demande.

Tableau 5. Modèles de fondations tierces disponibles pour être déployés à la demande dans watsonx.ai
Nom du modèle Fournisseur Prix par heure en USD Catégorie d'hébergement de modèles Fenêtre contextuelle
(jetons d'entrée et de sortie)
flan-t5-xl-3b Google $5.22 Petit 4,096
flan-t5-xxl-11b Google $5.22 Petit 4,096
flan-ul2-20b Google $5.22 Petit 4,096
llama-2-13b-chat Meta $5.22 Petit 4,096
llama-2-70b-chat Meta $20.85 Grand 4,096
llama-3-8b-instruct Meta $5.22 Petit 8 192
llama-3-70b-instruct Meta $20.85 Grand 8 192
llama-3-1-8b Meta $5.22 Petit 131 072
llama-3-1-8b-instruct Meta $5.22 Petit 131 072
llama-3-3-70b-instruct Meta $10.40 Moyen 8 192
llama-3-3-70b-instruct-hf Meta $20.85 Grand 8 192
mixtral-8x7b-base Mistral AI $10.40 Moyen 32 768
mixtral-8x7b-instruct-v01 Mistral AI $10.40 Moyen 32 768
mistral-nemo-instruct-2407 Mistral AI $5.22 Petit 131 072
mt0-xxl-13b BigScience $5.22 Petit 4,096

 

Modèles de fondations adaptés à la demande

Vous pouvez personnaliser les modèles de base suivants en les paramétrant dans watsonx.ai:

Pour plus d'informations, voir Tuning Studio.

En savoir plus

Rubrique parent: Développement de solutions d'IA génératives

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus