Verwalten des watsonx.ai Runtime-Dienst-Endpunkts

Letzte Aktualisierung: 23. Apr. 2025
Verwalten des watsonx.ai Runtime-Dienst-Endpunkts

Sie können IBM Cloud -Konnektivitätsoptionen verwenden, um über Serviceendpunkte sicher auf Cloud-Services zuzugreifen. Wenn Sie eine watsonx.ai Runtime Service-Instanz bereitstellen, können Sie wählen, ob Sie über das öffentliche Internet (Standardeinstellung) oder über das private Netzwerk IBM Cloud auf Ihren Service zugreifen möchten.

Wie Sie auf Service-Endpunkte zugreifen, hängt von der verwendeten Cloud-Plattform ab.

Zugriff auf Endpunkte auf IBM Cloud

Auf der Seite 'Servicebereitstellung' können Sie einen Standardendpunkt aus den folgenden Optionen auswählen:

Weitere Informationen hierzu finden Sie unter IBM Cloud-Serviceendpunkte.

Öffentliches Netz

Sie können Endpunkte des öffentlichen Netzwerks verwenden, um eine Verbindung zur watsonx.ai Runtime Service-Instanz im öffentlichen Netzwerk herzustellen. Ihre Umgebung muss über Internetzugriff verfügen, damit eine Verbindung hergestellt werden kann.

Privates Netz

Sie können private Netzwerkendpunkte verwenden, um sich mit Ihrer IBM watsonx.ai Runtime Service-Instanz über das IBM Cloud Private Netzwerk zu verbinden. Nachdem Sie Ihren watsonx.ai Runtime-Dienst für die Verwendung privater Endpunkte konfiguriert haben, ist der Dienst nicht mehr über das öffentliche Internet zugänglich.

Private URLs für watsonx.ai Runtime

Die privaten URLs für watsonx.ai Runtime lauten für jede Region wie folgt:

Verwendung des IBM Cloud -Dienstes zur Aktivierung privater Endpunkte

Führen Sie die folgenden Schritte aus, um private Netzendpunkte in Ihren Clustern zu ermöglichen:

  1. Verwenden Sie die IBM Cloud -CLI , um Ihrem Konto die Verwendung von IBM Cloud -Serviceendpunkten zu ermöglichen.
  2. Bereitstellung einer watsonx.ai Runtime Service-Instanz mit privaten Endpunkten.

Bereitstellung mit Service-Endpunkten (Dallas, Frankfurt, Tokio, London)

Sie können eine watsonx.ai Runtime-Service-Instanz mit Service-Endpunkt mithilfe von IBM Cloud UI oder IBM Cloud CLI bereitstellen.

Serviceendpunkt mit IBM Cloud -Benutzerschnittstelle bereitstellen

Um die Endpunkte Ihrer IBM watsonx.ai Runtime Service-Instanz zu konfigurieren, können Sie das Feld Endpunkte auf der IBM Cloud verwenden. Sie können ein öffentliches, ein privates oder ein gemischtes Netz konfigurieren.

Endpunkt aus dem Servicekatalog konfigurieren

IBM Cloud-CLI

Wenn Sie eine IBM watsonx.ai Runtime-Service-Instanz über die IBM Cloud CLI bereitstellen, verwenden Sie die Befehlszeilenoption service-endpoints, um die watsonx.ai Runtime-Endpunkte zu konfigurieren. Sie können den Wert public (Standardwert), private oder public-and-private angeben:

ibmcloud resource service-instance-create <service instance name> pm-20 <plan_name> <region>  --service-endpoints <private/public/public-and-private>

Beispiel:

ibmcloud resource service-instance-create wml-instance pm-20 standard us-south -p  --service-endpoints private

oder

ibmcloud resource service-instance-create wml-instance pm-20 standard us-south --service-endpoints public-and-private

Bereitstellung eines Dienst-Endpunkts (Sydney und Toronto)

Um einen Service-Endpunkt für eine watsonx.ai Runtime-Instanz in der Region Sydney oder Toronto bereitzustellen, müssen Sie den Zugriff auf einen privaten Katalog anfordern. Nachdem der Antrag genehmigt wurde, können Sie den Endpunkt als Virtual Private Endpoint freigeben.

Antrag auf Zugang zu einem privaten Katalog

Um Zugang zu einem privaten Katalog zu beantragen, gehen Sie folgendermaßen vor:

  1. Verwenden Sie die IBM Cloud -CLI , um Ihrem Konto die Verwendung von IBM Cloud -Serviceendpunkten zu ermöglichen.
  2. Wenden Sie sich an den IBM Support und bitten Sie das watsonx.ai Runtime-Team, Ihnen Zugang zu einem privaten Katalog zu gewähren. Sie müssen Ihre IBM Cloud accountID mit dem Antrag übermitteln.
  3. Wenn das watsonx.ai Runtime-Team den Zugang zum privaten Katalog für die Konto-ID des Kunden freigibt, können Sie die abgeschlossene Anfrage und die Katalogdetails unter Verwalten>Kataloge>Anfragen zur gemeinsamen Nutzung in der Konsole IBM Cloud einsehen. Sie können dann ein virtuelles privates Endpunkt-Gateway erstellen.
  4. Wählen Sie Virtual Private Endpoint als Katalogtyp. Beispiel: Gemeinsame Nutzung einer Anfrage über die Konsole IBM Cloud
  5. Befolgen Sie die Schritte zum Erstellen eines virtuellen privaten Endpunkt-Gateways für VPC. Verwenden Sie die folgenden Namen für die Anzeige des privaten Katalogs in den Rechenzentren in Sydney und Toronto:
    • SYDNEY : mcsp-wml-sydprod
    • TORONTO : mcsp-wml-torprod

Überprüfung eines Aktienantrags

Um die Freigabeanforderung von der IBM Cloud CLI aus zu überprüfen, verwenden Sie den folgenden Befehl:

{
"first": "/api/v1-beta/shareapproval/vpe/access/source/pending?limit=100",
"limit": 100,
"resource_count": 1,
"resources": [
{
"_id": "-acct-fc3acf288b1b451e8cb981b2b9423b14:apr-acct:ba083c5877a64197a36b55d259812dfa:vpe:account",
"_rev": "1-6703f335f8ca2330aa22a7e542700d58",
"account": "fc3acf288b1b451e8cb981b2b9423b14",
"account_type": 3,
"approval_state": "pending",
"created": "2025-02-26T01:15:21.513749288-05:00",
"id": "-acct-fc3acf288b1b451e8cb981b2b9423b14",
"target_account": "ba083c5877a64197a36b55d259812dfa",
"target_kind": "vpe"
}
]
}

Genehmigung eines Anteilsantrags

Für die Genehmigung von Freigabeanträgen können Sie die IBM Cloud UI oder CLI verwenden. Wenn die Option zur Genehmigung von Freigabeanfragen in der Benutzeroberfläche nicht verfügbar ist, können Sie IBM Cloud CLI verwenden, um die Anfrage zu genehmigen.

Um eine Freigabeanforderung von der IBM Cloud CLI aus zu genehmigen, verwenden Sie den folgenden Befehl:

ibmcloud catalog account set-approval-state-source --object-kind vpe --approval-state approved -account-ids "<account ID>"

Überprüfung der Zulassung

Um zu überprüfen, ob der Kunde die Freigabeanforderung akzeptiert hat, verwenden Sie den folgenden Befehl:

ibmcloud catalog account get-approval-list-source --object-kind vpe --approval-state approved
{
"first": "/api/v1-beta/shareapproval/vpe/access/source/approved?limit=100",
"limit": 100,
"resource_count": 1,
"resources": [
{
"_id": "<account id>",
"_rev": "2-93907d1b7d449c1a82914dfde604f316",
"account": "fc3acf288b1b451e8cb981b2b9423b14",
"account_type": 3,
"created": "2025-02-26T01:15:21.513749288-05:00",
"id": "<account id>",
"target_account": "ba083c5877a64197a36b55d259812dfa",
"target_kind": "vpe"
}
]
}

Dieser Befehl gibt eine Liste der genehmigten Anfragen zurück, einschließlich der Konto-ID und der Zielkonto-ID.

Übergeordnetes Thema: Einsatz und Verwaltung von KI-Ressourcen