Verwalten des watsonx.ai Runtime-Dienst-Endpunkts
Sie können IBM Cloud -Konnektivitätsoptionen verwenden, um über Serviceendpunkte sicher auf Cloud-Services zuzugreifen. Wenn Sie eine watsonx.ai Runtime Service-Instanz bereitstellen, können Sie wählen, ob Sie über das öffentliche Internet (Standardeinstellung) oder über das private Netzwerk IBM Cloud auf Ihren Service zugreifen möchten.
Wie Sie auf Service-Endpunkte zugreifen, hängt von der verwendeten Cloud-Plattform ab.
Zugriff auf Endpunkte auf IBM Cloud
Auf der Seite 'Servicebereitstellung' können Sie einen Standardendpunkt aus den folgenden Optionen auswählen:
- Öffentliches Netz
- Privates Netz
- Sowohl öffentliche als auch private Netze
Weitere Informationen hierzu finden Sie unter IBM Cloud-Serviceendpunkte.
Öffentliches Netz
Sie können Endpunkte des öffentlichen Netzwerks verwenden, um eine Verbindung zur watsonx.ai Runtime Service-Instanz im öffentlichen Netzwerk herzustellen. Ihre Umgebung muss über Internetzugriff verfügen, damit eine Verbindung hergestellt werden kann.
Privates Netz
Sie können private Netzwerkendpunkte verwenden, um sich mit Ihrer IBM watsonx.ai Runtime Service-Instanz über das IBM Cloud Private Netzwerk zu verbinden. Nachdem Sie Ihren watsonx.ai Runtime-Dienst für die Verwendung privater Endpunkte konfiguriert haben, ist der Dienst nicht mehr über das öffentliche Internet zugänglich.
Private URLs für watsonx.ai Runtime
Die privaten URLs für watsonx.ai Runtime lauten für jede Region wie folgt:
Verwendung des IBM Cloud -Dienstes zur Aktivierung privater Endpunkte
Führen Sie die folgenden Schritte aus, um private Netzendpunkte in Ihren Clustern zu ermöglichen:
- Verwenden Sie die IBM Cloud -CLI , um Ihrem Konto die Verwendung von IBM Cloud -Serviceendpunkten zu ermöglichen.
- Bereitstellung einer watsonx.ai Runtime Service-Instanz mit privaten Endpunkten.
Bereitstellung mit Service-Endpunkten (Dallas, Frankfurt, Tokio, London)
Sie können eine watsonx.ai Runtime-Service-Instanz mit Service-Endpunkt mithilfe von IBM Cloud UI oder IBM Cloud CLI bereitstellen.
Serviceendpunkt mit IBM Cloud -Benutzerschnittstelle bereitstellen
Um die Endpunkte Ihrer IBM watsonx.ai Runtime Service-Instanz zu konfigurieren, können Sie das Feld Endpunkte auf der IBM Cloud verwenden. Sie können ein öffentliches, ein privates oder ein gemischtes Netz konfigurieren.
IBM Cloud-CLI
Wenn Sie eine IBM watsonx.ai Runtime-Service-Instanz über die IBM Cloud CLI bereitstellen, verwenden Sie die Befehlszeilenoption service-endpoints, um die watsonx.ai Runtime-Endpunkte zu konfigurieren. Sie können den Wert
(Standardwert), public
oder private
angeben:public-and-private
ibmcloud resource service-instance-create <service instance name> pm-20 <plan_name> <region> --service-endpoints <private/public/public-and-private>
Beispiel:
ibmcloud resource service-instance-create wml-instance pm-20 standard us-south -p --service-endpoints private
oder
ibmcloud resource service-instance-create wml-instance pm-20 standard us-south --service-endpoints public-and-private
Bereitstellung eines Dienst-Endpunkts (Sydney und Toronto)
Um einen Service-Endpunkt für eine watsonx.ai Runtime-Instanz in der Region Sydney oder Toronto bereitzustellen, müssen Sie den Zugriff auf einen privaten Katalog anfordern. Nachdem der Antrag genehmigt wurde, können Sie den Endpunkt als Virtual Private Endpoint freigeben.
Antrag auf Zugang zu einem privaten Katalog
Um Zugang zu einem privaten Katalog zu beantragen, gehen Sie folgendermaßen vor:
- Verwenden Sie die IBM Cloud -CLI , um Ihrem Konto die Verwendung von IBM Cloud -Serviceendpunkten zu ermöglichen.
- Wenden Sie sich an den IBM Support und bitten Sie das watsonx.ai Runtime-Team, Ihnen Zugang zu einem privaten Katalog zu gewähren. Sie müssen Ihre IBM Cloud accountID mit dem Antrag übermitteln.
- Wenn das watsonx.ai Runtime-Team den Zugang zum privaten Katalog für die Konto-ID des Kunden freigibt, können Sie die abgeschlossene Anfrage und die Katalogdetails unter Verwalten>Kataloge>Anfragen zur gemeinsamen Nutzung in der Konsole IBM Cloud einsehen. Sie können dann ein virtuelles privates Endpunkt-Gateway erstellen.
- Wählen Sie Virtual Private Endpoint als Katalogtyp. Beispiel:
- Befolgen Sie die Schritte zum Erstellen eines virtuellen privaten Endpunkt-Gateways für VPC. Verwenden Sie die folgenden Namen für die Anzeige des privaten Katalogs in den Rechenzentren in Sydney und Toronto:
- SYDNEY : mcsp-wml-sydprod
- TORONTO : mcsp-wml-torprod
Überprüfung der Zulassung
Um zu überprüfen, ob der Kunde die Freigabeanforderung akzeptiert hat, verwenden Sie den folgenden Befehl:
ibmcloud catalog account get-approval-list-source --object-kind vpe --approval-state approved
{
"first": "/api/v1-beta/shareapproval/vpe/access/source/approved?limit=100",
"limit": 100,
"resource_count": 1,
"resources": [
{
"_id": "<account id>",
"_rev": "2-93907d1b7d449c1a82914dfde604f316",
"account": "fc3acf288b1b451e8cb981b2b9423b14",
"account_type": 3,
"created": "2025-02-26T01:15:21.513749288-05:00",
"id": "<account id>",
"target_account": "ba083c5877a64197a36b55d259812dfa",
"target_kind": "vpe"
}
]
}
Dieser Befehl gibt eine Liste der genehmigten Anfragen zurück, einschließlich der Konto-ID und der Zielkonto-ID.
Übergeordnetes Thema: Einsatz und Verwaltung von KI-Ressourcen