Déployer des services d'IA avec des outils visuels
Lorsque vous utilisez des outils visuels pour créer une application destinée à un cas d'utilisation complexe tel que Retrieval Augmented Generation (RAG) ou l'IA agentique, votre application est déployée en tant que service d'IA. Un service d'IA est une unité de code déployable qui capture la logique de votre application d'IA générative. Après avoir déployé un service d'IA, vous pouvez le tester à partir de l'interface de test fournie dans l'espace ou accéder au point de terminaison pour mettre le déploiement en production.
Des outils visuels qui déploient des services d'IA
Lorsque vous créez une application avec l'un des outils suivants, votre application est déployée en tant que service d'IA :
Agent Lab : Vous pouvez utiliser l'Agent Lab pour créer et déployer des solutions d'IA agentiques dans watsonx.ai. Les solutions d'IA agentique que vous construisez dans l'Agent Lab sont déployées sous forme de services d'IA.
Prompt Lab : Vous pouvez utiliser l' Prompt Lab, pour construire et déployer une solution d'IA générative pour un cas d'utilisation complexe, tel que la génération augmentée par récupération (RAG). Les solutions d'IA générative pour les cas d'utilisation complexes que vous construisez dans l'Agent Lab sont déployées sous forme de services d'IA.
AutoAI (pour RAG ) : Vous pouvez utiliser AutoAI pour créer des expériences d'IA générative basées sur RAG et déployer le pipeline le plus performant en tant que service d'IA.
Par exemple, un service d'IA pour une invite qui dialogue avec des documents de base peut gérer la logique de récupération du contenu de l'index des documents vectorisés ainsi que l'inférence avec un modèle de base pour générer une réponse.
Méthodes de déploiement
Selon vos besoins, vous pouvez déployer votre application en tant que service d'IA à partir d'un outil visuel pris en charge en utilisant l'une des approches suivantes :
- Déploiement direct (voie rapide ) : utilisez cette option si votre solution est complète et que vous ne souhaitez pas y apporter de modifications supplémentaires. Si vous choisissez de déployer en utilisant un chemin rapide, un déploiement en ligne est créé automatiquement.
- Carnet de déploiement : utilisez cette option si vous souhaitez personnaliser votre solution en ajoutant ou en modifiant le code, par exemple pour créer un déploiement par lots.
En plus des outils visuels, vous pouvez déployer manuellement votre application en tant que service IA directement depuis le projet si vous avez créé un actif de service IA par programmation.
Le tableau suivant compare les options de déploiement de différents outils et projets :
Outil | Déploiement en ligne | Déploiement par lot | Déploiement direct (Fast-path) | Notebook de déploiement |
---|---|---|---|---|
Prompt Lab | Automatique | Manuel | Processus en deux étapes | Pris en charge; généré automatiquement |
Agent Lab | Automatique | Manuel | Processus en deux étapes | Pris en charge; généré automatiquement |
AutoAI (pour RAG) | Automatique | Manuel | Processus en plusieurs étapes | Non pris en charge |
Projets | Manuel | Manuel | Processus en plusieurs étapes | Pris en charge; créé manuellement |
Le service d'IA capture la logique de votre cas d'utilisation et contient la fonction de génération, qui est une unité de code déployable. Le déploiement est exposé en tant que point de terminaison de l'API REST auquel d'autres applications peuvent accéder. Vous pouvez envoyer une demande au point de terminaison de l'API REST afin d'utiliser le service d'IA déployé pour l'inférence. Le service d'IA déployé traite la demande et renvoie une réponse.
Déploiement à partir des outils
Utilisez le chemin rapide pour déployer directement à partir d'un outil visuel ou enregistrez votre travail dans un carnet de déploiement pour déployer votre solution en tant que service IA.
Déploiement avec chemin rapide
Si vous avez utilisé un outil visuel pris en charge pour créer votre application dans watsonx.ai, vous pouvez déployer votre solution directement depuis l'outil. Le déploiement directement à partir des outils vous offre un moyen rapide de déployer votre solution en tant que service IA et crée automatiquement un déploiement en ligne. Le déploiement ne pouvant pas être modifié après sa création, vous devez vous assurer que la solution est entièrement construite avant de la déployer.
Pour créer un déploiement par lots, vous devez déployer votre solution manuellement à partir d'un projet. Pour plus d'informations, voir Déploiement à partir d'un projet.
Pour déployer une solution complexe telle que RAG d' Prompt Lab, ou pour déployer un agent de l'Agent Lab, procédez comme suit :
- Cliquez sur Déployer dans l'espace de travail.
- Saisissez les détails de votre déploiement, choisissez ou créez votre espace de déploiement, puis cliquez sur Créer.
Pour déployer un modèle RAG à partir d' AutoAI,, procédez comme suit :
- Dans l'outil de création d'expériences d' AutoAI, choisissez le pipeline le plus performant et cliquez sur Enregistrer sous.
- Choisissez Retrieval and generation comme objectif et sélectionnez le type d'actif de service d'IA.
- Activez l'option permettant de promouvoir et de déployer le service AI dans un espace de déploiement.
- Choisissez un espace de déploiement existant ou créez-en un nouveau, puis cliquez sur Créer et déployer.
Cette procédure crée automatiquement un déploiement en ligne. Le déploiement est créé et s'ouvre dans l'espace cible afin que vous puissiez tester le déploiement ou accéder au point de terminaison pour l'inférence.
Déploiement à partir d'un carnet de notes généré automatiquement
Après avoir créé une application dans un outil visuel, si vous souhaitez personnaliser la logique de votre application avant le déploiement, vous pouvez enregistrer votre travail dans un notebook de déploiement. Par exemple, vous pouvez éditer et exécuter un carnet RAG ( AutoAI ) si vous souhaitez ajouter de nouveaux documents à la base de données vectorisée, puis appliquer le modèle RAG optimisé que vous avez découvert avec l'outil d' AutoAI s à l'index mis à jour.
Le notebook de déploiement contient le code permettant de tester, promouvoir et déployer un service d'IA. Pour déployer votre application, vous devez enregistrer votre travail dans un carnet de déploiement. Vous ne pouvez pas utiliser un ordinateur portable standard pour déployer un service d'IA.
Pour enregistrer votre solution dans un carnet de déploiement sur Prompt Lab ou Agent Lab :
- Cliquez sur l'icône Enregistrer
et sélectionnez Enregistrer sous dans le menu déroulant.
- Dans la boîte de dialogue Enregistrer votre travail, sélectionnez Carnet de déploiement.
- Dans la section Définir les détails, saisissez un nom et une description facultative pour votre carnet de déploiement.
- Cliquez sur Sauvegarder.
Lorsque vous enregistrez votre travail dans un carnet de déploiement, watsonx.ai génère automatiquement un carnet qui contient le code pour tester, promouvoir et déployer un service d'IA. Pour créer un déploiement en ligne pour votre service AI, exécutez les cellules dans le carnet de déploiement.
Déploiement à partir d'un projet
Créez un déploiement en ligne ou par lots pour déployer votre application en tant que service d'IA. Les déploiements en ligne conviennent aux applications nécessitant une haute disponibilité et des mises à jour en temps réel, tandis que les déploiements par lots sont idéaux pour les mises à jour complexes ou lorsque les temps d'arrêt planifiés sont acceptables.
Prérequis
Vous devez définir les informations d'identification de votre tâche en générant une clé API. Pour plus d'informations, voir Gestion des informations d'identification des tâches.
Création de déploiements en ligne
Si vous avez enregistré un actif IA dans un projet en tant qu'actif de service IA déployable, suivez ces étapes pour promouvoir le service IA et créer un déploiement en ligne :
- Dans l' onglet Actifs de votre projet ou de votre espace de déploiement, sélectionnez Déployer pour le service AI.
- Choisissez ou créez un espace de déploiement.
- Sélectionnez En ligne comme type de déploiement.
- Saisissez un nom pour votre déploiement et, éventuellement, un nom de service, une description et des balises.
- Cliquez sur Créer.
Création de déploiements par lots
Si vous avez enregistré un actif IA dans un projet en tant qu'actif de service IA déployable, procédez comme suit pour promouvoir le service IA et créer un déploiement par lots :
- Depuis votre espace de déploiement, rendez-vous dans l'onglet Actifs.
- Pour votre ressource de service AI dans la liste des ressources, cliquez sur l'icône Menu et sélectionnez Déployer.
- Sélectionnez Lot comme type de déploiement.
- Saisissez un nom pour votre déploiement et, éventuellement, un nom de service, une description et des balises.
- Sélectionnez une spécification matérielle :
- Extra small : 1 CPU et 4 Go de RAM
- Petit : 2 CPU et 8 Go de RAM
- Moyen : 4 CPU et 16 Go de RAM
- Grande : 8 CPU et 32 Go de RAM
- Très grande : 16 CPU et 64 Go de RAM
- Cliquez sur Créer.
Etapes suivantes
Sujet parent : Déployer des services d'IA