Méthodes de déploiement du modèle de fondation dans watsonx.ai
Dernière mise à jour : 25 mars 2025
Méthodes de déploiement du modèle de fondation dans watsonx.ai
Vous pouvez choisir parmi une collection de modèles tiers et de modèles de base d' IBM s pour l'inférence dans IBM watsonx.ai. Trouvez les modèles de base qui correspondent le mieux aux besoins de votre application d'IA générative et à votre budget.
Vous pouvez héberger des modèles de fondations dans watsonx.ai de différentes manières.
Fourniture de modèles de fond de teint prêts à l'emploi
Copy link to section
Une collection de modèles tiers et de modèles de fondations d' IBM s est déployée sur du matériel multi-locataires dans IBM watsonx.ai par IBM. Vous pouvez demander ces modèles de base dans l' Prompt Lab, ou par programmation. Vous payez en fonction du nombre de jetons utilisés.
Pour commencer à déduire un modèle de fondation fourni, procédez comme suit :
Dans le menu principal, sélectionnez Centre de ressources.
Cliquez sur Afficher tout dans la section Paiement par jeton.
Cliquez sur une tuile de modèle de fondation, puis cliquez sur Ouvrir dans l' Prompt Lab.
Déployer des modèles de fondation à la demande
Copy link to section
Un modèle de déploiement à la demande est un exemple de modèle de base géré par l' IBM, que vous déployez et qui est dédié à l'usage exclusif de votre organisation. Seuls les collègues qui ont accès au déploiement peuvent déduire le modèle de base. Un déploiement dédié signifie des interactions plus rapides et plus réactives sans limite de débit.
Pour travailler avec un modèle de déploiement sur demande, procédez comme suit :
Dans le menu principal, sélectionnez Centre de ressources.
Cliquez sur Tout afficher dans la section Paiement à l'heure.
Cliquez sur une tuile de modèle de fondation, puis sur Déployer.
En plus de travailler avec des modèles de fondation gérés par IBM, vous pouvez télécharger et déployer vos propres modèles de fondation. Une fois les modèles personnalisés déployés et enregistrés sur watsonx.ai, vous pouvez créer des invites qui infèrent les modèles personnalisés à partir de l'API Prompt Lab ou watsonx.ai.
L'instance du modèle de base personnalisé que vous déployez est dédiée à votre usage. Un déploiement dédié signifie des interactions plus rapides et plus réactives. L'hébergement du modèle de fondation est facturé à l'heure.
Un sous-ensemble des modèles de base fournis peut être personnalisé en fonction de vos besoins en ajustant rapidement le modèle à partir de l'API watsonx.ai ou Tuning Studio. Un modèle de fondation à réglage rapide repose sur le modèle de fondation déployé sous-jacent. Le modèle sous-jacent peut être obsolète. Vous payez pour les ressources que vous consommez pour ajuster le modèle. Une fois le modèle ajusté, vous payez en jetons utilisés pour inférer le modèle.
Vous pouvez personnaliser les modèles de fondation suivants en les modifiant rapidement watsonx.ai:
Pour obtenir la liste complète des modèles avec lesquels vous pouvez travailler dans watsonx.ai, consultez la rubrique Modèles de fondations pris en charge.