0 / 0
Retourner à la version anglaise de la documentation
Déployer des services d'IA par codage direct
Dernière mise à jour : 08 nov. 2024
Déployer des services d'IA par codage direct

Vous pouvez créer un service d'IA personnalisé qui est adapté à votre application d'IA générative à partir de la base. Par exemple, si vous déployez un actif qui utilise la génération augmentée par récupération (RAG), vous pouvez capturer la logique de récupération des réponses à partir des documents de base dans le service d'IA.

Présentation du processus

Le graphique suivant illustre le processus de codification des services d'IA.

Vous pouvez créer un carnet de notes contenant le service AI et les connexions au sein du projet. Le service AI capture la logique de votre application RAG et contient la fonction de génération, qui est une unité de code déployable. La fonction de génération est promue dans l'espace de déploiement, qui est utilisé pour créer un déploiement. Le déploiement est exposé en tant que point de terminaison de l'API REST auquel d'autres applications peuvent accéder. Vous pouvez envoyer une demande au point de terminaison de l'API REST pour utiliser le service d'IA déployé pour l'inférence. Le service d'IA déployé traite la demande et renvoie une réponse.

Cas d'utilisation du codage direct

Tâches de création et de déploiement de services d'IA

Voici les étapes à suivre pour créer, déployer et gérer les services d'IA :

  1. Créer un service d'IA: Définir un service d'IA dans un notebook en utilisant Python. Le service d'IA doit répondre à des exigences spécifiques pour être déployé en tant que service d'IA.
  2. Tester le service d'IA: Testez localement la logique de codage de votre service d'IA.
  3. Créer des ressources de service d'IA: Après avoir créé et testé le service d'IA, vous devez le conditionner en tant que ressource déployable.
  4. Déployer des ressources de service d'IA: Déployer le service d'IA en ligne ou par lots.
  5. Tester le déploiement d'un service d'IA: Testez votre service d'IA déployé pour l'inférence en ligne ou la notation par lots.
  6. Gérer les services d'IA: Accéder aux détails du déploiement et les mettre à jour. Mettre à l'échelle ou supprimer le déploiement à partir de l'interface utilisateur ou par programme.

Exemples de carnets de notes pour la création et le déploiement de services d'IA

Pour apprendre à créer et à déployer des services d'IA de manière programmatique, consultez les exemples de carnets de notes suivants :

Exemples de carnets de notes pour les services d'IA
Nom d'échantillon Infrastructure Techniques mises en évidence
Utiliser watsonx et meta-llama/llama-3-2-11b-vision-instruct pour fonctionner comme un service d'IA Python Configuration de l'environnement "
Création d'un service d'IA "
Test local du fonctionnement du service d'IA "
Déploiement du service d'IA "
Exécution d'un service d'IA
Utiliser watsonx, Elasticsearch et LangChain pour répondre aux questions (RAG) LangChain Mise en place de l'environnement "
Téléchargement de l'ensemble de données de test.
Définition du foundation model sur watsonx
Mise en place des informations de connectivité avec Elasticsearch
Génération d'une réponse augmentée à une question
Création d'un service d'IA
Test de la fonction du service d'IA localement
Déploiement du service d'IA
Utiliser watsonx et meta-llama/llama-3-1-70b-instruct pour créer un service d'IA LangGraph Configuration de l'environnement "
Création d'un service d'IA "
Test local du fonctionnement du service d'IA "
Déploiement du service d'IA "
Exécution d'un service d'IA

En savoir plus

Sujet parent : Déployer des services d'IA