Gérer le point de terminaison du service watsonx.ai Runtime
Vous pouvez utiliser les options de connectivité d'IBM Cloud pour accéder aux services cloud en toute sécurité en utilisant des points de terminaison de service. Lorsque vous provisionnez une instance de service watsonx.ai Runtime, vous pouvez choisir d'accéder à votre service via l'internet public, ce qui est le paramètre par défaut, ou via le réseau privé IBM Cloud
La manière dont vous accédez aux points de terminaison de service dépend de la plate-forme Cloud que vous utilisez.
Accéder aux points d'extrémité sur IBM Cloud
Vous pouvez utiliser la page Service provisioning pour choisir un point de terminaison par défaut parmi les options suivantes :
- Réseau public
- Réseau privé
- Réseaux publics et privés
Pour plus d'informations, voir Nœuds finaux de service IBM Cloud.
Réseau public
Vous pouvez utiliser les points d'extrémité du réseau public pour vous connecter à l'instance de service watsonx.ai Runtime sur le réseau public. Votre environnement doit avoir un accès à Internet pour se connecter.
Réseau privé
Vous pouvez utiliser des points d'extrémité de réseau privé pour vous connecter à votre instance de service IBM watsonx.ai Runtime sur le réseau IBM Cloud Private Après avoir configuré votre service watsonx.ai Runtime pour utiliser des points de terminaison privés, le service n'est pas accessible depuis l'internet public.
URLs privées pour l'exécution de watsonx.ai
Les URLs privés de watsonx.ai Runtime pour chaque région sont les suivants :
- Dallas - https://private.us-south.ml.cloud.ibm.com
- Londres - https://private.eu-gb.ml.cloud.ibm.com
- Francfort - https://private.eu-de.ml.cloud.ibm.com
- Tokyo - https://private.jp-tok.ml.cloud.ibm.com
Utilisation d'un service d' IBM Cloud s pour activer des points de terminaison privés
Suivez ces étapes pour activer les points d'extrémité du réseau privé sur vos clusters :
- Utilisez IBM Cloud CLI pour permettre à votre compte d'utiliser les points de terminaison des services IBM Cloud
- Fournir une instance de service watsonx.ai Runtime avec des points d'extrémité privés.
Approvisionnement avec des points de terminaison de service (Dallas, Francfort, Tokyo, Londres)
Vous pouvez provisionner une instance de service watsonx.ai Runtime avec un point de terminaison de service en utilisant IBM Cloud UI ou IBM Cloud CLI.
Provisionnement d'un point de terminaison de service avec IBM Cloud UI
Pour configurer les points de terminaison de votre instance de service IBM watsonx.ai Runtime, vous pouvez utiliser le champ Points de terminaison sur la page du catalogue IBM Cloud Vous pouvez configurer un réseau public, privé ou mixte.
Interface de ligne de commande IBM Cloud
Si vous provisionnez une instance de service IBM watsonx.ai Runtime à l'aide de la CLI IBM Cloud, utilisez l'option de ligne de commande service-endpoints pour configurer les points d'extrémité watsonx.ai Runtime. Vous pouvez spécifier la valeur
(valeur par défaut), public
ou private
:public-and-private
ibmcloud resource service-instance-create <service instance name> pm-20 <plan_name> <region> --service-endpoints <private/public/public-and-private>
Par exemple :
ibmcloud resource service-instance-create wml-instance pm-20 standard us-south -p --service-endpoints private
ou
ibmcloud resource service-instance-create wml-instance pm-20 standard us-south --service-endpoints public-and-private
Mise en place d'un point de service (Sydney et Toronto)
Pour provisionner un point de service pour une instance de watsonx.ai Runtime dans la région de Sydney ou de Toronto, vous devez demander l'accès à un catalogue privé. Une fois la demande approuvée, vous pouvez partager le point d'extrémité en tant que point d'extrémité privé virtuel.
Demande d'accès à un catalogue privé
Pour demander l'accès à un catalogue privé, suivez les étapes suivantes :
- Utilisez IBM Cloud CLI pour permettre à votre compte d'utiliser les points de terminaison des services IBM Cloud
- Contactez IBM Support et soumettez une demande, en demandant à l'équipe de watsonx.ai Runtime de vous donner accès à un catalogue privé. Vous devez fournir votre IBM Cloud accountID avec la demande.
- Lorsque l'équipe watsonx.ai Runtime donne accès au catalogue privé à l'identifiant du compte client, vous pouvez voir la demande complétée et les détails du catalogue à partir de Manage>Catalogs>Share requests (Gérer>Catalogues>Demandes de partage) dans la console IBM Cloud. Vous pouvez ensuite créer une passerelle privée virtuelle.
- Sélectionnez Virtual Private Endpoint comme type de catalogue. Par exemple :
- Suivez les étapes pour créer un point d'accès privé virtuel pour les passerelles VPC. Utilisez les noms suivants comme noms d'affichage du catalogue privé pour les centres de données de Sydney et de Toronto :
- SYDNEY : mcsp-wml-sydprod
- TORONTO : mcsp-wml-torprod
Vérification de l'approbation
Pour vérifier que le client a accepté la demande de partage, utilisez la commande suivante :
ibmcloud catalog account get-approval-list-source --object-kind vpe --approval-state approved
{
"first": "/api/v1-beta/shareapproval/vpe/access/source/approved?limit=100",
"limit": 100,
"resource_count": 1,
"resources": [
{
"_id": "<account id>",
"_rev": "2-93907d1b7d449c1a82914dfde604f316",
"account": "fc3acf288b1b451e8cb981b2b9423b14",
"account_type": 3,
"created": "2025-02-26T01:15:21.513749288-05:00",
"id": "<account id>",
"target_account": "ba083c5877a64197a36b55d259812dfa",
"target_kind": "vpe"
}
]
}
Cette commande renvoie une liste des demandes approuvées, y compris l'ID du compte et l'ID du compte cible.
Sujet parent : Déploiement et gestion des ressources d'IA