0 / 0

Déployer des modèles de fondation adaptés

Dernière mise à jour : 01 mai 2025
Déployer des modèles de fondation adaptés

Vous pouvez régler un modèle pour l'adapter à une tâche, un ensemble de données ou un cas d'utilisation spécifique. Le processus de réglage permet d'ajuster les paramètres ou les poids d'un modèle pré-entraîné et d'améliorer les performances et la précision du modèle. Déployez un modèle adapté afin de pouvoir l'ajouter à un flux de travail et commencer à utiliser les modèles de base de manière significative.

Façons de travailler

Quelle que soit la méthode utilisée pour ajuster votre modèle, vous devez attendre la fin de l'expérience d'ajustement avant de déployer le modèle ajusté.

En fonction de la méthode choisie pour l'entraînement de votre modèle, vous pouvez déployer des modèles optimisés de la manière suivante :

  • Depuis l'interface utilisateur des projets : Une interface utilisateur graphique pour déployer les modèles accordés qui sont stockés en tant que ressources d'expériences d'accord dans votre projet. Pour plus de détails, voir Déploiement d'un modèle accordé à partir d'un projet.
  • Méthodes programmatiques pour déployer des modèles ajustés : Utilisez ces méthodes pour les modèles PEFT (parameter-efficient fine-tuned).

Après avoir déployé un modèle adapté, vous pouvez l'inférer en fournissant des données textuelles en entrée pour générer des prédictions en temps réel.

Déploiement d'un modèle adapté à partir d'un projet

Lorsque vous utilisez le site Tuning Studio pour créer votre expérience de réglage, vous pouvez déployer directement le modèle réglé qui en résulte.

Avant de commencer

Vous devez définir les informations d'identification de votre tâche en générant une clé API. Pour plus d'informations, voir Gestion des informations d'identification des tâches.

Procédure

Pour déployer un modèle optimisé, procédez comme suit:

  1. Dans l'onglet Actifs du projet, cliquez sur le type d'actif Expériences.

  2. Cliquez pour ouvrir l'expérimentation d'optimisation pour le modèle que vous souhaitez déployer.

  3. Dans la liste Modèles optimisés , recherchez l'expérimentation d'optimisation terminée, puis cliquez sur Nouveau déploiement.

  4. Nommez le modèle optimisé.

    Le nom de l'expérimentation d'ajustement est utilisé comme nom de modèle ajusté si vous ne le modifiez pas. Le nom est suivi d'un nombre entre parenthèses, ce qui compte les déploiements. Le nombre commence à un et est incrémenté d'un à chaque fois que vous déployez cette expérimentation d'optimisation.

  5. Facultatif: ajoutez une description et des balises.

  6. Pour le Conteneur de déploiement, choisissez l'une des options suivantes :

    • Ce projet : Déploie le modèle ajusté et l'ajoute à votre projet où vous pouvez tester le modèle ajusté. Vous pouvez à tout moment promouvoir le déploiement du modèle accordé vers un espace de déploiement. Choisissez cette option si vous souhaitez tester davantage le modèle mis au point avant de l'utiliser en production.
    • Espace de déploiement : Promouvoir le modèle mis au point vers un espace de déploiement et déployer le modèle mis au point. Un espace de déploiement est distinct du projet dans lequel vous créez l'actif. Cette séparation vous permet de promouvoir des biens de plusieurs projets vers un espace et de déployer des biens dans plus d'un espace. Choisissez cette option lorsque le modèle mis au point est prêt à être promu pour une utilisation en production.

    Pour plus d'informations sur cette option, voir Utilisation d'un espace de déploiement.

    Conseil : sélectionnez l'option Afficher après la création afin de pouvoir retrouver facilement votre modèle une fois le processus de déploiement terminé.
  7. Cliquez sur Deploy.

Une fois le modèle ajusté déployé, une copie du modèle ajusté est stockée dans votre projet en tant que ressource de modèle.

Utilisation d'un espace de déploiement

Lorsque vous choisissez un espace de déploiement comme conteneur pour votre modèle adapté, le modèle adapté est promu vers un espace de déploiement, puis déployé. Un espace de déploiement est associé aux services suivants qu'il utilise pour déployer des actifs:

  • watsonx.ai Runtime : Un produit avec des outils et des services que vous pouvez utiliser pour construire, former et déployer des modèles d'apprentissage automatique. Ce service héberge votre modèle transformé.

  • IBM Cloud Object Storage : Une plateforme sécurisée pour le stockage de données structurées et non structurées. Votre ressource de modèle déployée est stockée dans un Cloud Object Storage associé à votre projet.

Pour plus d'informations, reportez-vous à la page relative aux espaces de déploiement.

Pour utiliser un espace de déploiement, procédez comme suit :

  1. Après avoir choisi Espace de déploiement comme conteneur de déploiement, dans le champ Espace de déploiement cible, choisissez un espace de déploiement.

    L'espace de déploiement doit être associé à une instance d'apprentissage automatique qui se trouve dans le même compte que le projet dans lequel le modèle optimisé a été créé.

    Si vous ne disposez pas d'un espace de déploiement, choisissez Créer un nouvel espace de déploiement, puis suivez les étapes de la rubrique Création d'espaces de déploiement.

  2. Dans la zone Nom du service de déploiement , ajoutez un libellé pour le déploiement.

    Le nom de service est utilisé dans l' URL, pour le point de terminaison de l'API qui identifie votre déploiement. L'ajout d'un nom est utile car le nom lisible que vous ajoutez remplace un ID long généré par le système qui est affecté autrement.

    Le nom de service extrait également le déploiement des détails de son instance de service. Les applications peuvent faire référence à ce nom, ce qui permet de modifier l'instance de service sous-jacente sans affecter les utilisateurs.

    Le nom peut comporter jusqu'à 36 caractères. Les caractères pris en charge sont [a-z,0-9, _ ].

    Le nom doit être unique dans la région IBM Cloud . Vous pouvez être invité à modifier le nom de service si le nom que vous choisissez est déjà utilisé.

Récupération du point de terminaison du déploiement du modèle

Suivez ces étapes pour récupérer le point de terminaison URL pour votre déploiement de modèle accordé :

  1. Dans l'onglet Déploiements de votre projet ou espace de déploiement, cliquez sur le nom du déploiement.
  2. Dans l'onglet Référence API, vous trouverez les liens vers les points de terminaison privés et publics ainsi que des extraits de code que vous pouvez utiliser pour inclure les détails des points de terminaison dans une application.

Vous avez besoin du point de terminaison du modèle URL pour accéder au déploiement à partir de vos applications.

Etapes suivantes

Une fois que vous avez déployé un modèle adapté, vous pouvez le tester en le référençant. Vous pouvez gérer le déploiement de votre modèle en mettant à jour, en mettant à l'échelle ou en supprimant les détails du déploiement.

En savoir plus

Sujet parent : Déploiement des actifs du modèle de base