watsonx.ai 런타임 서비스 엔드포인트 관리하기

마지막 업데이트 날짜: 2025년 4월 17일
watsonx.ai 런타임 서비스 엔드포인트 관리하기

서비스 엔드포인트를 사용하여 클라우드 서비스에 안전하게 액세스하기 위해 IBM Cloud 연결 옵션을 사용할 수 있습니다. watsonx.ai Runtime 서비스 인스턴스를 프로비저닝할 때 기본 설정인 공용 인터넷을 통해 서비스에 액세스할지, 아니면 IBM Cloud 사설 네트워크를 통해 액세스할지 선택할 수 있습니다.

서비스 엔드포인트에 액세스하는 방법은 사용 중인 클라우드 플랫폼에 따라 다릅니다.

접근하는 방법 IBM Cloud

서비스 프로비저닝 페이지에서 다음 옵션 중에서 기본 엔드포인트를 선택할 수 있습니다:

자세한 정보는 IBM Cloud 서비스 엔드포인트를 참조하십시오.

공용 네트워크

공용 네트워크 엔드포인트를 사용하여 공용 네트워크의 watsonx.ai 런타임 서비스 인스턴스에 연결할 수 있습니다. 사용자 환경에는 연결하기 위한 인터넷 액세스 권한이 있어야 합니다.

사설 네트워크

프라이빗 네트워크 엔드포인트를 사용하여 IBM Cloud Private 네트워크를 통해 IBM watsonx.ai 런타임 서비스 인스턴스에 연결할 수 있습니다. 비공개 엔드포인트를 사용하도록 watsonx.ai 런타임 서비스를 구성한 후에는 공용 인터넷에서 서비스에 액세스할 수 없습니다.

watsonx.ai 런타임용 비공개 URL

각 지역의 watsonx.ai 런타임에 대한 비공개 URL은 다음과 같습니다:

IBM Cloud 서비스를 사용하여 개인 엔드포인트를 활성화하기

클러스터에서 프라이빗 네트워크 엔드포인트를 사용 설정하려면 다음 단계를 따르세요:

  1. IBM Cloud CLI를 사용하여 계정에서 IBM Cloud 서비스 엔드포인트를 사용할 수 있도록 설정합니다.
  2. 프라이빗 엔드포인트로 watsonx.ai 런타임 서비스 인스턴스를 프로비저닝합니다.

서비스 엔드포인트(댈러스, 프랑크푸르트, 도쿄, 런던)를 통한 프로비저닝

IBM Cloud UI 또는 IBM Cloud CLI를 사용하여 서비스 엔드포인트를 통해 watsonx.ai 런타임 서비스 인스턴스를 프로비저닝할 수 있습니다.

IBM Cloud UI로 서비스 엔드포인트 프로비저닝하기

IBM watsonx.ai 런타임 서비스 인스턴스의 엔드포인트를 구성하려면 IBM Cloud 카탈로그 페이지의 엔드포인트 필드를 사용할 수 있습니다. 공용, 비공개 또는 혼합 네트워크를 구성할 수 있습니다.

서비스 카탈로그에서 엔드포인트 구성

IBM Cloud CLI

IBM Cloud CLI를 사용하여 IBM watsonx.ai Runtime 서비스 인스턴스를 프로비저닝하는 경우, 명령줄 옵션 서비스-엔드포인트를 사용하여 watsonx.ai Runtime 엔드포인트를 구성합니다. public(기본값), private 또는 public-and-private 값을 지정할 수 있습니다.

ibmcloud resource service-instance-create <service instance name> pm-20 <plan_name> <region>  --service-endpoints <private/public/public-and-private>

예를 들어,

ibmcloud resource service-instance-create wml-instance pm-20 standard us-south -p  --service-endpoints private

또는

ibmcloud resource service-instance-create wml-instance pm-20 standard us-south --service-endpoints public-and-private

서비스 엔드포인트 프로비저닝(시드니 및 토론토)

시드니 또는 토론토 지역에서 watsonx.ai 런타임 인스턴스에 대한 서비스 엔드포인트를 프로비저닝하려면 비공개 카탈로그에 대한 액세스를 요청해야 합니다. 요청이 승인되면 엔드포인트를 가상 사설 엔드포인트로 공유할 수 있습니다.

비공개 카탈로그 액세스 요청하기

비공개 카탈로그에 대한 액세스를 요청하려면 다음 단계를 따르세요:

  1. IBM Cloud CLI를 사용하여 계정에서 IBM Cloud 서비스 엔드포인트를 사용할 수 있도록 설정합니다.
  2. IBM 지원팀에 문의하여 요청을 제출하고 watsonx.ai 런타임 팀에 비공개 카탈로그에 대한 액세스 권한 제공을 요청하세요. 요청과 함께 IBM Cloud accountID 이메일을 보내야 합니다.
  3. watsonx.ai 런타임 팀이 고객 계정 ID로 비공개 카탈로그에 대한 액세스 권한을 제공하면 IBM Cloud 콘솔의 관리>카탈로그>요청 공유에서 완료된 요청 및 카탈로그 세부 정보를 볼 수 있습니다. 그런 다음 가상 사설 엔드포인트 게이트웨이를 만들 수 있습니다.
  4. 카탈로그 유형으로 가상 사설 엔드포인트를 선택합니다. 예를 들면 다음과 같습니다. IBM Cloud 콘솔에서 요청 공유
  5. 다음 단계에 따라 VPC용 가상 사설 엔드포인트 게이트웨이를 만들 수 있습니다. 시드니 및 토론토 데이터 센터의 비공개 카탈로그 표시 이름으로 다음을 사용합니다:
    • 시드니: MCSP-WML-SYDPROD
    • 토론토: MCSP-WML-TORPROD

공유 요청 검토 중

IBM Cloud CLI에서 공유 요청을 검토하려면 다음 명령을 사용합니다:

{
"first": "/api/v1-beta/shareapproval/vpe/access/source/pending?limit=100",
"limit": 100,
"resource_count": 1,
"resources": [
{
"_id": "-acct-fc3acf288b1b451e8cb981b2b9423b14:apr-acct:ba083c5877a64197a36b55d259812dfa:vpe:account",
"_rev": "1-6703f335f8ca2330aa22a7e542700d58",
"account": "fc3acf288b1b451e8cb981b2b9423b14",
"account_type": 3,
"approval_state": "pending",
"created": "2025-02-26T01:15:21.513749288-05:00",
"id": "-acct-fc3acf288b1b451e8cb981b2b9423b14",
"target_account": "ba083c5877a64197a36b55d259812dfa",
"target_kind": "vpe"
}
]
}

공유 요청 승인하기

공유 요청을 승인하려면 IBM Cloud UI 또는 CLI를 사용할 수 있습니다. UI에서 공유 요청을 승인하는 옵션을 사용할 수 없는 경우 IBM Cloud CLI를 사용하여 요청을 승인할 수 있습니다.

IBM Cloud CLI에서 공유 요청을 승인하려면 다음 명령을 사용합니다:

ibmcloud catalog account set-approval-state-source --object-kind vpe --approval-state approved -account-ids "<account ID>"

승인 확인

고객이 공유 요청을 수락했는지 확인하려면 다음 명령을 사용하세요:

ibmcloud catalog account get-approval-list-source --object-kind vpe --approval-state approved
{
"first": "/api/v1-beta/shareapproval/vpe/access/source/approved?limit=100",
"limit": 100,
"resource_count": 1,
"resources": [
{
"_id": "<account id>",
"_rev": "2-93907d1b7d449c1a82914dfde604f316",
"account": "fc3acf288b1b451e8cb981b2b9423b14",
"account_type": 3,
"created": "2025-02-26T01:15:21.513749288-05:00",
"id": "<account id>",
"target_account": "ba083c5877a64197a36b55d259812dfa",
"target_kind": "vpe"
}
]
}

이 명령은 계정 ID 및 대상 계정 ID를 포함하여 승인된 요청 목록을 반환합니다.

상위 주제: AI 자산 배치 및 관리