Méthodes de déploiement du modèle de fondation dans watsonx.ai

Dernière mise à jour : 25 mars 2025
Méthodes de déploiement du modèle de fondation dans watsonx.ai

Vous pouvez choisir parmi une collection de modèles tiers et de modèles de base d' IBM s pour l'inférence dans IBM watsonx.ai. Trouvez les modèles de base qui correspondent le mieux aux besoins de votre application d'IA générative et à votre budget.

Vous pouvez héberger des modèles de fondations dans watsonx.ai de différentes manières.

Si vous souhaitez déployer des modèles de base dans votre propre centre de données, vous pouvez acheter le logiciel d' watsonx.ai. Pour plus d'informations, voir Vue d'ensemble des logiciels d' IBM, watsonx.ai et IBM watsonx.governance.

Selon la manière dont les modèles de fondation sont hébergés dans watsonx.ai, ils sont classés comme suit :

Comparaison des méthodes de déploiement

Pour vous aider à choisir la méthode de déploiement la mieux adaptée à votre cas d'utilisation, consultez le tableau comparatif.

Tableau 1. Différences entre les méthodes de déploiement du modèle de fondation
Type de déploiement Disponible à partir du Mécanisme de déploiement environnement d'hébergement Méthode de facturation Politique de dépréciation
Modèles de base fournis avec watsonx.ai • Centre de ressources > Paiement par jeton
• Prompt Lab
Organisé et déployé par IBM Matériel multi-locataires Par jetons utilisés Obsolète selon le cycle de vie publié. Voir Cycle de vie du modèle Foundation.
Déployer des modèles de fondation à la demande • Centre de ressources > Payer à l'heure
• Prompt Lab
Organisé et déployé par IBM à votre demande Matériel dédié Par heure déployée Votre modèle déployé n'est pas obsolète
Modèles de fondation personnalisés • Prompt Lab Organisé et déployé par vous Matériel dédié Par heure déployée Non déprécié
Modèles de fondations à ajustement rapide • Prompt Lab Adapté et déployé par vous Matériel multi-locataires • La formation est facturée par CUH (
) • L'inférence est facturée par jetons utilisés
Déprécié lorsque le modèle sous-jacent est déprécié, sauf si vous ajoutez le modèle sous-jacent en tant que modèle de base personnalisé

Pour plus de détails sur la manière dont le prix des modèles est calculé et contrôlé, voir Détails de facturation pour les ressources IA génératives.

Fourniture de modèles de fond de teint prêts à l'emploi

Une collection de modèles tiers et de modèles de fondations d' IBM s est déployée sur du matériel multi-locataires dans IBM watsonx.ai par IBM. Vous pouvez demander ces modèles de base dans l' Prompt Lab, ou par programmation. Vous payez en fonction du nombre de jetons utilisés.

Pour commencer à déduire un modèle de fondation fourni, procédez comme suit :

  1. Dans le menu principal, sélectionnez Centre de ressources.
  2. Cliquez sur Afficher tout dans la section Paiement par jeton.
  3. Cliquez sur une tuile de modèle de fondation, puis cliquez sur Ouvrir dans l' Prompt Lab.

Déployer des modèles de fondation à la demande

Un modèle de déploiement à la demande est un exemple de modèle de base géré par l' IBM, que vous déployez et qui est dédié à l'usage exclusif de votre organisation. Seuls les collègues qui ont accès au déploiement peuvent déduire le modèle de base. Un déploiement dédié signifie des interactions plus rapides et plus réactives sans limite de débit.

Pour travailler avec un modèle de déploiement sur demande, procédez comme suit :

  1. Dans le menu principal, sélectionnez Centre de ressources.
  2. Cliquez sur Tout afficher dans la section Paiement à l'heure.
  3. Cliquez sur une tuile de modèle de fondation, puis sur Déployer.

Pour plus d'informations, voir Déploiement de modèles de base à la demande.

Modèles de fondation personnalisés

En plus de travailler avec des modèles de fondation gérés par IBM, vous pouvez télécharger et déployer vos propres modèles de fondation. Une fois les modèles personnalisés déployés et enregistrés sur watsonx.ai, vous pouvez créer des invites qui infèrent les modèles personnalisés à partir de l'API Prompt Lab ou watsonx.ai.

L'instance du modèle de base personnalisé que vous déployez est dédiée à votre usage. Un déploiement dédié signifie des interactions plus rapides et plus réactives. L'hébergement du modèle de fondation est facturé à l'heure.

Pour en savoir plus sur le téléchargement, l'enregistrement et le déploiement d'un modèle de fondation personnalisé, consultez la rubrique Déploiement d'un modèle de fondation personnalisé.

Modèles de fondations à ajustement rapide

Un sous-ensemble des modèles de base fournis peut être personnalisé en fonction de vos besoins en ajustant rapidement le modèle à partir de l'API watsonx.ai ou Tuning Studio. Un modèle de fondation à réglage rapide repose sur le modèle de fondation déployé sous-jacent. Le modèle sous-jacent peut être obsolète. Vous payez pour les ressources que vous consommez pour ajuster le modèle. Une fois le modèle ajusté, vous payez en jetons utilisés pour inférer le modèle.

Vous pouvez personnaliser les modèles de fondation suivants en les modifiant rapidement watsonx.ai:

Pour plus d'informations, voir Tuning Studio.

En savoir plus

Pour obtenir la liste complète des modèles avec lesquels vous pouvez travailler dans watsonx.ai, consultez la rubrique Modèles de fondations pris en charge.

Sujet parent : Solutions Gen AI