Déployez un modèle optimisé pour pouvoir l'ajouter à un flux de travaux métier et commencer à utiliser des modèles de base de manière significative.
Avant de commencer
L'expérience de réglage que vous avez utilisée pour régler le foundation model doit être terminée. Pour plus d'informations, voir Optimisation d'un foundation model.
Vous devez définir les informations d'identification de votre tâche en générant une clé API. Pour plus d'informations, voir Gestion des informations d'identification des tâches.
déployer un modèle affiné
Pour déployer un modèle optimisé, procédez comme suit:
Dans le menu de navigation, développez Projets, puis cliquez sur Tous les projets.
Cliquez pour ouvrir votre projet.
Dans l'onglet Actifs , cliquez sur le type d'actif Expériences .
Cliquez pour ouvrir l'expérimentation d'optimisation pour le modèle que vous souhaitez déployer.
Dans la liste Modèles optimisés , recherchez l'expérimentation d'optimisation terminée, puis cliquez sur Nouveau déploiement.
Nommez le modèle optimisé.
Le nom de l'expérimentation d'ajustement est utilisé comme nom de modèle ajusté si vous ne le modifiez pas. Le nom est suivi d'un nombre entre parenthèses, ce qui compte les déploiements. Le nombre commence à un et est incrémenté d'un à chaque fois que vous déployez cette expérimentation d'optimisation.
Facultatif: ajoutez une description et des balises.
Pour le Conteneur de déploiement, choisissez l'une des options suivantes :
- Ce projet : Déploie le modèle ajusté et l'ajoute à votre projet où vous pouvez tester le modèle ajusté. Vous pouvez à tout moment promouvoir le déploiement du modèle accordé vers un espace de déploiement. Choisissez cette option si vous souhaitez tester davantage le modèle mis au point avant de l'utiliser en production.
- Espace de déploiement : Promouvoir le modèle mis au point vers un espace de déploiement et déployer le modèle mis au point. Un espace de déploiement est distinct du projet dans lequel vous créez l'actif. Cette séparation vous permet de promouvoir des biens de plusieurs projets vers un espace et de déployer des biens dans plus d'un espace. Choisissez cette option lorsque le modèle mis au point est prêt à être promu pour une utilisation en production.
Pour plus d'informations sur cette option, voir Utilisation d'un espace de déploiement.
Conseil : Sélectionnez l'option d'affichage après la création. Sinon, vous devez effectuer des étapes supplémentaires pour trouver votre modèle déployé.
Cliquez sur Deploy.
Une fois le modèle ajusté déployé, une copie du modèle ajusté est stockée dans votre projet en tant que ressource de modèle.
Utilisation d'un espace de déploiement
Lorsque vous choisissez un espace de déploiement comme conteneur pour votre modèle adapté, le modèle adapté est promu vers un espace de déploiement, puis déployé. Un espace de déploiement est associé aux services suivants qu'il utilise pour déployer des actifs:
watsonx.ai Runtime : Un produit avec des outils et des services que vous pouvez utiliser pour construire, former et déployer des modèles d'apprentissage automatique. Ce service héberge votre modèle transformé.
IBM Cloud Object Storage : Une plateforme sécurisée pour le stockage de données structurées et non structurées. Votre ressource de modèle déployée est stockée dans un Cloud Object Storage associé à votre projet.
Pour plus d'informations, reportez-vous à la page relative aux espaces de déploiement.
Pour utiliser un espace de déploiement, procédez comme suit :
Après avoir choisi Espace de déploiement comme conteneur de déploiement, dans le champ Espace de déploiement cible, choisissez un espace de déploiement.
L'espace de déploiement doit être associé à une instance d'apprentissage automatique qui se trouve dans le même compte que le projet dans lequel le modèle optimisé a été créé.
Si vous ne disposez pas d'un espace de déploiement, choisissez Créer un nouvel espace de déploiement, puis suivez les étapes de la rubrique Création d'espaces de déploiement.
Dans la zone Nom du service de déploiement , ajoutez un libellé pour le déploiement.
Le nom de service est utilisé dans l'URL du noeud final d'API qui identifie votre déploiement. L'ajout d'un nom est utile car le nom lisible que vous ajoutez remplace un ID long généré par le système qui est affecté autrement.
Le nom de service extrait également le déploiement des détails de son instance de service. Les applications peuvent faire référence à ce nom, ce qui permet de modifier l'instance de service sous-jacente sans affecter les utilisateurs.
Le nom peut comporter jusqu'à 36 caractères. Les caractères pris en charge sont [a-z,0-9, _ ].
Le nom doit être unique dans la région IBM Cloud . Vous pouvez être invité à modifier le nom de service si le nom que vous choisissez est déjà utilisé.
Test du modèle déployé
Le véritable test de votre modèle optimisé est la façon dont il répond aux entrées qui suivent les modèles optimisés.
Vous pouvez tester le modèle optimisé à partir de l'une des pages suivantes:
- Projet : Utile lorsque vous souhaitez tester votre modèle pendant les phases de développement et de test avant de le mettre en production.
- Espace de déploiement: utile lorsque vous souhaitez tester votre modèle à l'aide d'un programme. Dans l'onglet Référence d'API , vous pouvez trouver des informations sur les noeuds finaux disponibles et des exemples de code. Vous pouvez également soumettre une entrée sous forme de texte et choisir de renvoyer la sortie ou dans un flux, au fur et à mesure que la sortie est générée. Toutefois, vous ne pouvez pas modifier les paramètres d'invite pour le texte d'entrée.
- Prompt Lab : Utile lorsque vous souhaitez utiliser un outil doté d'une interface utilisateur intuitive pour inviter les modèles de fondation. Vous pouvez personnaliser les paramètres d'invite pour chaque entrée. Vous pouvez également sauvegarder l'invite en tant que bloc-notes pour pouvoir interagir avec elle à l'aide d'un programme.
Tester le modèle de déploiement dans un projet
Pour tester votre modèle dans le projet, suivez les étapes suivantes :
Dans votre projet, cliquez sur l'onglet Déploiements.
Cliquez sur le nom de votre modèle déployé.
Cliquez sur l'onglet Test .
Dans la zone Données d'entrée , ajoutez une invite qui suit le modèle d'invite que votre modèle optimisé est entraîné à reconnaître, puis cliquez sur Générer.
Vous pouvez cliquer sur Afficher les paramètres pour afficher les paramètres d'invite qui sont appliqués au modèle par défaut. Pour modifier les paramètres d'invite, vous devez accéder au laboratoire d'invite.
Test du modèle de déploiement dans un espace de déploiement
Pour tester votre modèle dans un espace de déploiement, suivez les étapes suivantes :
Dans le menu de navigation, sélectionnez Déploiements.
Cliquez sur le nom de l'espace de déploiement dans lequel vous avez déployé le modèle optimisé.
Cliquez sur le nom de votre modèle déployé.
Cliquez sur l'onglet Test .
Dans la zone Données d'entrée , ajoutez une invite qui suit le modèle d'invite que votre modèle optimisé est entraîné à reconnaître, puis cliquez sur Générer.
Vous pouvez cliquer sur Afficher les paramètres pour afficher les paramètres d'invite qui sont appliqués au modèle par défaut. Pour modifier les paramètres d'invite, vous devez accéder au laboratoire d'invite.
Test du modèle de déploiement dans Prompt Lab
Pour tester votre modèle dans Prompt Lab, suivez les étapes suivantes :
Suivez les étapes de la procédure précédente pour ouvrir le modèle déployé dans l'espace de projet ou de déploiement.
Dans le projet, cliquez sur Ouvrir dans Prompt Lab. Si vous travaillez dans un espace de déploiement, vous êtes invité à choisir le projet dans lequel vous souhaitez travailler avec le modèle.
Prompt Lab s'ouvre et le modèle accordé que vous avez déployé est sélectionné dans le champ Modèle.
Dans la section Try , ajoutez une invite à la zone Input qui suit le modèle d'invite que votre modèle optimisé est entraîné à reconnaître, puis cliquez sur Generate.
Pour plus d'informations sur l'utilisation de l'éditeur d'invite, voir Prompt Lab.
En savoir plus
Sujet parent : Déployer les actifs du foundation model