0 / 0
Retourner à la version anglaise de la documentation
Déployer des services d'IA à partir de Prompt Lab avec un chemin rapide
Dernière mise à jour : 07 nov. 2024
Déployer des services d'IA à partir de Prompt Lab avec un chemin rapide

Vous pouvez utiliser le Prompt Lab pour dialoguer avec des documents en fournissant un index vectoriel. Lorsque vous déployez votre travail en tant que service d'IA, la logique de votre application RAG est automatiquement capturée dans un actif de service d'IA et un déploiement en ligne est créé pour l'actif.

Avant de commencer

  1. Vous devez disposer d'un espace de déploiement cible existant ou en créer un nouveau dans lequel vous souhaitez déployer votre ressource de service d'IA.
  2. Vous devez créer un index vectoriel (magasin vectoriel en mémoire ou base de données vectorielle) pour dialoguer avec les documents. Pour plus d'informations, voir Discuter avec des documents et des images.
  3. Vous devez définir les informations d'identification de votre tâche en générant une clé API. Pour plus d'informations, voir Gestion des informations d'identification des tâches.

Création d'un déploiement en ligne pour les services d'IA

Suivez ces étapes pour créer un déploiement en ligne pour un service d'IA à partir de l'interface utilisateur du laboratoire watsonx.ai Prompt :

  1. À partir de votre projet, ouvrez le laboratoire d'invite et discutez avec les documents pour construire une solution RAG. Pour plus d'informations, voir Discuter avec des documents et des images.

  2. Pour déployer votre travail en tant que service d'IA, cliquez sur Déployer.

    Une capture d'écran montre comment déployer des services d'IA à partir du Prompt Lab avec un chemin d'accès rapide

  3. Dans la boîte de dialogue Déployer en tant que service AI, entrez les détails de votre déploiement :

    a. Saisissez un nom pour le déploiement de votre service d'IA.
    b. Sélectionnez un projet cible ou un espace de déploiement dans le menu déroulant.
    C. Facultatif: Fournissez une description et cochez la case si vous souhaitez afficher la ressource de service AI dans le projet après le déploiement.

  4. Cliquez sur Deploy.

Remarque :

Cette procédure crée automatiquement un déploiement en ligne pour votre ressource de service AI dans votre espace de projet ou de déploiement. Pour créer une répartition par lots pour votre ressource de service AI, vous devez suivre la procédure de création manuelle d'une répartition par lots à partir de votre espace de répartition. Pour plus d'informations, voir Déploiement de ressources de services d'IA.

En savoir plus

Déployer des services d'IA à partir de Prompt Lab avec des ordinateurs portables

Sujet parent : Déployer des services d'IA avec Prompt Lab