Gérer le point de terminaison du service watsonx.ai Runtime

Dernière mise à jour : 23 avr. 2025
Gérer le point de terminaison du service watsonx.ai Runtime

Vous pouvez utiliser les options de connectivité d'IBM Cloud pour accéder aux services cloud en toute sécurité en utilisant des points de terminaison de service. Lorsque vous provisionnez une instance de service watsonx.ai Runtime, vous pouvez choisir d'accéder à votre service via l'internet public, ce qui est le paramètre par défaut, ou via le réseau privé IBM Cloud

La manière dont vous accédez aux points de terminaison de service dépend de la plate-forme Cloud que vous utilisez.

Accéder aux points d'extrémité sur IBM Cloud

Vous pouvez utiliser la page Service provisioning pour choisir un point de terminaison par défaut parmi les options suivantes :

Pour plus d'informations, voir Nœuds finaux de service IBM Cloud.

Réseau public

Vous pouvez utiliser les points d'extrémité du réseau public pour vous connecter à l'instance de service watsonx.ai Runtime sur le réseau public. Votre environnement doit avoir un accès à Internet pour se connecter.

Réseau privé

Vous pouvez utiliser des points d'extrémité de réseau privé pour vous connecter à votre instance de service IBM watsonx.ai Runtime sur le réseau IBM Cloud Private Après avoir configuré votre service watsonx.ai Runtime pour utiliser des points de terminaison privés, le service n'est pas accessible depuis l'internet public.

URLs privées pour l'exécution de watsonx.ai

Les URLs privés de watsonx.ai Runtime pour chaque région sont les suivants :

Utilisation d'un service d' IBM Cloud s pour activer des points de terminaison privés

Suivez ces étapes pour activer les points d'extrémité du réseau privé sur vos clusters :

  1. Utilisez IBM Cloud CLI pour permettre à votre compte d'utiliser les points de terminaison des services IBM Cloud
  2. Fournir une instance de service watsonx.ai Runtime avec des points d'extrémité privés.

Approvisionnement avec des points de terminaison de service (Dallas, Francfort, Tokyo, Londres)

Vous pouvez provisionner une instance de service watsonx.ai Runtime avec un point de terminaison de service en utilisant IBM Cloud UI ou IBM Cloud CLI.

Provisionnement d'un point de terminaison de service avec IBM Cloud UI

Pour configurer les points de terminaison de votre instance de service IBM watsonx.ai Runtime, vous pouvez utiliser le champ Points de terminaison sur la page du catalogue IBM Cloud Vous pouvez configurer un réseau public, privé ou mixte.

Configurer le point d'arrivée à partir du catalogue de services

Interface de ligne de commande IBM Cloud

Si vous provisionnez une instance de service IBM watsonx.ai Runtime à l'aide de la CLI IBM Cloud, utilisez l'option de ligne de commande service-endpoints pour configurer les points d'extrémité watsonx.ai Runtime. Vous pouvez spécifier la valeur public (valeur par défaut), privateou public-and-private:

ibmcloud resource service-instance-create <service instance name> pm-20 <plan_name> <region>  --service-endpoints <private/public/public-and-private>

Par exemple :

ibmcloud resource service-instance-create wml-instance pm-20 standard us-south -p  --service-endpoints private

ou

ibmcloud resource service-instance-create wml-instance pm-20 standard us-south --service-endpoints public-and-private

Mise en place d'un point de service (Sydney et Toronto)

Pour provisionner un point de service pour une instance de watsonx.ai Runtime dans la région de Sydney ou de Toronto, vous devez demander l'accès à un catalogue privé. Une fois la demande approuvée, vous pouvez partager le point d'extrémité en tant que point d'extrémité privé virtuel.

Demande d'accès à un catalogue privé

Pour demander l'accès à un catalogue privé, suivez les étapes suivantes :

  1. Utilisez IBM Cloud CLI pour permettre à votre compte d'utiliser les points de terminaison des services IBM Cloud
  2. Contactez IBM Support et soumettez une demande, en demandant à l'équipe de watsonx.ai Runtime de vous donner accès à un catalogue privé. Vous devez fournir votre IBM Cloud accountID avec la demande.
  3. Lorsque l'équipe watsonx.ai Runtime donne accès au catalogue privé à l'identifiant du compte client, vous pouvez voir la demande complétée et les détails du catalogue à partir de Manage>Catalogs>Share requests (Gérer>Catalogues>Demandes de partage) dans la console IBM Cloud. Vous pouvez ensuite créer une passerelle privée virtuelle.
  4. Sélectionnez Virtual Private Endpoint comme type de catalogue. Par exemple :Partager une requête depuis la console IBM Cloud
  5. Suivez les étapes pour créer un point d'accès privé virtuel pour les passerelles VPC. Utilisez les noms suivants comme noms d'affichage du catalogue privé pour les centres de données de Sydney et de Toronto :
    • SYDNEY : mcsp-wml-sydprod
    • TORONTO : mcsp-wml-torprod

Examen d'une demande de partage

Pour examiner la demande de partage à partir de l'interface CLI de IBM Cloud, utilisez la commande suivante :

{
"first": "/api/v1-beta/shareapproval/vpe/access/source/pending?limit=100",
"limit": 100,
"resource_count": 1,
"resources": [
{
"_id": "-acct-fc3acf288b1b451e8cb981b2b9423b14:apr-acct:ba083c5877a64197a36b55d259812dfa:vpe:account",
"_rev": "1-6703f335f8ca2330aa22a7e542700d58",
"account": "fc3acf288b1b451e8cb981b2b9423b14",
"account_type": 3,
"approval_state": "pending",
"created": "2025-02-26T01:15:21.513749288-05:00",
"id": "-acct-fc3acf288b1b451e8cb981b2b9423b14",
"target_account": "ba083c5877a64197a36b55d259812dfa",
"target_kind": "vpe"
}
]
}

Approbation d'une demande d'action

Pour approuver les demandes de partage, vous pouvez utiliser l'interface utilisateur IBM Cloud ou le CLI. Si l'option d'approbation des demandes de partage n'est pas disponible dans l'interface utilisateur, vous pouvez utiliser IBM Cloud CLI pour approuver la demande.

Pour approuver une demande de partage à partir de l'interface CLI de IBM Cloud, utilisez la commande suivante :

ibmcloud catalog account set-approval-state-source --object-kind vpe --approval-state approved -account-ids "<account ID>"

Vérification de l'approbation

Pour vérifier que le client a accepté la demande de partage, utilisez la commande suivante :

ibmcloud catalog account get-approval-list-source --object-kind vpe --approval-state approved
{
"first": "/api/v1-beta/shareapproval/vpe/access/source/approved?limit=100",
"limit": 100,
"resource_count": 1,
"resources": [
{
"_id": "<account id>",
"_rev": "2-93907d1b7d449c1a82914dfde604f316",
"account": "fc3acf288b1b451e8cb981b2b9423b14",
"account_type": 3,
"created": "2025-02-26T01:15:21.513749288-05:00",
"id": "<account id>",
"target_account": "ba083c5877a64197a36b55d259812dfa",
"target_kind": "vpe"
}
]
}

Cette commande renvoie une liste des demandes approuvées, y compris l'ID du compte et l'ID du compte cible.

Sujet parent : Déploiement et gestion des ressources d'IA