0 / 0

Mise en place d'un magasin de vecteurs watsonx.data Milvus

Dernière mise à jour : 23 avr. 2025
Mise en place d'un magasin de vecteurs watsonx.data Milvus

Milvus est une base de données vectorielles conçue pour une recherche de similarités évolutive.

Vous pouvez associer un magasin de vecteurs Milvus à une invite de modèle de base afin d'utiliser les informations des documents du magasin pour ancrer l'entrée de l'invite dans les faits actuels.

Avant d'associer un magasin de vecteurs Milvus à une invite de modèle de fondation, vous devez configurer une connexion au magasin de vecteurs Milvus.

La procédure d'installation de Milvus dépend de votre plan de service watsonx.data :

Configuration et connexion automatiques à watsonx.data Milvus

Vous pouvez vous connecter automatiquement à watsonx.data Milvus si vous avez souscrit à une version d'essai de watsonx as a Service à partir du 10 avril 2025. Dans ce cas, une version d'essai de watsonx.data avec un service Milvus est automatiquement fournie. Lorsque vous discutez avec un document ou créez un index vectoriel et que vous sélectionnez Milvus et une instance IBM Cloud Object Storage, la connexion au magasin de vecteurs Milvus est automatiquement configurée.

Pour plus d'informations sur l'utilisation de votre magasin de vecteurs Milvus, consultez la documentation IBM Cloud : Travailler avec Milvus.

Configuration et connexion manuelles à watsonx.data Milvus

Si vous avez souscrit à watsonx.ai avant le 10 avril 2025, vous devez provisionner watsonx.data et configurer le service Milvus. Vous pouvez ensuite choisir de détecter et de compléter automatiquement les informations de connexion pour le magasin vectoriel Milvus. Dans certaines circonstances, il peut être nécessaire de spécifier manuellement les informations de connexion.

Mise en place des services watsonx.data et Milvus

Créez une base de données Milvus avec les documents que vous souhaitez mettre à disposition en tant que données d'ancrage.

Pour configurer une base de données Milvus, ajoutez Milvus en tant que service dans watsonx.data en suivant les étapes suivantes :

  1. Fournissez une instance de service de watsonx.data dans la même région où votre projet watsonx.ai est hébergé.

    Pour plus d'informations, voir IBM Cloud docs : Choix d'un plan watsonx.data et provisionnement d'une instance.

    Ce processus peut prendre environ 10 minutes.

  2. Depuis la console web watsonx.data, ajoutez le service Milvus à votre instance watsonx.data.

    Pour plus d'informations, voir IBM Cloud docs : Ajout du service Milvus.

Création d'une connexion automatique au magasin de données

Pour configurer le magasin, suivez les étapes suivantes :

  1. Sur la page d'aperçu de votre projet watsonx.ai, cliquez sur l'onglet Assets, puis choisissez New asset > Ground gen AI with vectorized documents.

  2. Choisir watsonx.data Milvus.

  3. Dans la section Détails de la base de données Vector, choisissez Se connecter automatiquement à Milvus sur watsonx.data.

    Remarque :

    L'option de connexion automatique n'est disponible que si une instance watsonx.data est provisionnée dans votre compte.

  4. Choisissez l'instance que vous souhaitez utiliser.

  5. Si vous n'avez pas de clé API: Un message s'affiche pour vous demander de créer une clé API à utiliser pour authentifier la connexion au magasin de données. Cliquez sur Créer.

    Une nouvelle page web s'ouvre où vous pouvez créer une clé API utilisateur. Créez la clé, puis revenez à la page de configuration de la connexion de données et cliquez sur Recharger pour utiliser la clé API que vous avez créée pour authentifier la connexion.

  6. Cliquez sur Créer une connexion.

  7. Optionnel: Examinez les détails de la connexion qui ont été ajoutés automatiquement.

  8. Cliquez sur Créer, puis sur Créer.

Une connexion au magasin de données est maintenant établie. Lorsque vous créez une ressource d'index vectoriel pour les documents de mise à la terre, vous pouvez choisir l'option Sélectionner ou créer un index vectoriel, puis sélectionner l'instance du magasin de données Milvus que vous venez de configurer.

Obtenir manuellement les détails du magasin de données Milvus

Collecter les détails de la connexion à la source de données.

  1. Depuis le service Milvus dans la console watsonx.data, notez la valeur de l'hôte gRPC.

    gRPC est un cadre d'appel de procédure à distance (RPC) qui permet aux services distribués de communiquer.

    Par exemple, la valeur de l'hôte gRPC peut être 5c3c2a83-b4gg-4d96-8da4-5a2f1739a496.example.appdomain.cloud:30439

  2. Dans la console IBM Cloud, créez une clé API personnelle et stockez-la en toute sécurité.

    Pour plus d'informations, voir Gestion des clés API des utilisateurs.

  3. Sur la page d'aperçu de votre projet watsonx.ai, cliquez sur l'onglet Assets, puis choisissez New asset > Ground gen AI with vectorized documents.

  4. Dans la section Détails de la base de données vectorielle, sélectionnez Sélectionner ou créer une connexion, puis sélectionnez Créer une connexion.

  5. Ajouter un nom pour la connexion.

  6. Pour les détails de la connexion, convertissez la valeur de l'hôte gRPC que vous avez notée précédemment en propriétés host et port distinctes.

    Par exemple, si la valeur de l'hôte gRPC est 5c3c2a83-b4gg-4d96-8da4-5a2f1739a496.example.appdomain.cloud:30439, spécifiez les propriétés comme suit :

    • host : Segment de la valeur avant les deux points. Par exemple, 5c3c2a83-b4gg-4d96-8da4-5a2f1739a496.example.appdomain.cloud.
    • port : Segment de la valeur après les deux points. Par exemple, 30439.
  7. Définir les informations d'identification pour la connexion.

    • Lorsque vous spécifiez le nom d'utilisateur, utilisez le format suivant :

      ibmlhapikey_<your-email-id>
      
    • Utilisez la clé API personnelle que vous avez créée précédemment comme mot de passe pour la connexion.

  8. Vérifiez que l'option Port est compatible avec SSL est sélectionnée.

  9. Si vous incluez un certificat, vous devez spécifier un certificat signé par une autorité de certification connue. Un certificat SSL auto-signé n'est pas suffisant.

  10. Cliquez sur Créer.

En savoir plus

Sujet parent : Créer un index vectoriel