머신 러닝 자산의 사용량을 CUH(용량 단위 시간)로 측정하는 방법에 대해 알아보세요.
watsonx.ai 런타임 컴퓨팅 사용량 및 가격
watsonx.ai 런타임 컴퓨팅 사용량은 활성 머신 러닝 인스턴스가 소비하는 CUH(용량 단위 시간)로 계산됩니다. 사용되는 시간당 용량 단위의 비율은 기계 학습 자산과 모델의 컴퓨팅 요구사항에 따라 판별됩니다. 예를 들어, 크고 복잡한 데이터 세트가 있는 모델은 더 작고 간단한 데이터 세트가 있는 모델보다 더 많은 훈련 리소스를 사용합니다. 동시 사용자와 요청을 더 많이 지원하도록 배치를 스케일링하면 CUH 소비량도 증가함에 유의하십시오.
모든 요금제에 적용됩니다:
- 교육에 소요되는 CUH(용량 단위 시간) 요금은 교육 도구, 하드웨어 사양 및 런타임 환경을 기준으로 합니다.
- 배포 시 소비되는 용량 단위 시간(CUH) 요금은 배포 유형, 하드웨어 사양 및 소프트웨어 사양에 따라 달라집니다.
- watsonx.ai 런타임은 각 단일 배포 공간에 대해 유지되는 배포 작업 수에 제한을 두고 있습니다. 한도를 초과하면 기존 작업을 삭제하거나 요금제를 업그레이드할 때까지 새 배포 작업을 만들 수 없습니다. 기본적으로, 작업 메타데이터는 30일 후 자동 삭제됩니다. 작업 작성 시 이 값을 대체할 수 있습니다. 작업 관리를 참조하십시오.
- 유휴 시간은 채점 요청 사이에 배포를 활성 상태로 간주하는 시간을 의미합니다. 배치가 주어진 기간 동안 스코어링 요청을 받지 않는 경우 배치가 비활성 또는 유휴 상태라 간주되어 SPSS를 제외한 모든 프레임워크에 대한 청구가 중지됩니다.
- 요금제는 명시된 요금 한도 이상을 허용하며, 실제 요금 한도는 명시된 한도보다 높을 수 있습니다. 예를 들어 라이트 요금제는 오류 없이 초당 2건 이상의 요청을 처리할 수 있습니다. 유료 요금제를 사용 중인데 오류로 요금 한도에 도달했다고 생각되면 IBM 지원팀에 문의하여 도움을 받으세요.
- 컴퓨팅 시간은 밀리초로 계산됩니다. 단, 각 고유 오퍼레이션에 대해 최소 1분이 있습니다. 즉, 12 초가 걸리는 훈련 실행은 용량 단위 시간 할당량에 대해 1분으로 청구되고 83.555초가 걸리는 훈련 실행은 계산된 대로 정확하게 청구됩니다.
- 온라인 배치가 용량 단위를 소모하는 방식은 프레임워크에 기반합니다. 일부 프레임워크의 경우 배치 영역에서 배치 자산이 활성화된 시간의 CUH 비용이 청구됩니다. 예를 들어, 일주일에 7일 동안 하루에 24시간 실행되는 온라인 배치 모드의 SPSS 모델은 해당 기간만큼의 CUH를 이용하며 이에 대해 비용이 청구됩니다. 활성 온라인 배치의 경우 유휴 시간이 없습니다. 다른 프레임워크의 경우, CUH는 스코어링 지속 기간에 따라 충전됩니다. CUH가 계산되는 방식에 대한 세부사항은 CUH 소비량 표를 참조하십시오.
자산 유형별 CUH 소비율
자산 유형 | 용량 유형 | 시간당 용량 단위 |
---|---|---|
AutoAI 실험 | vCPU 8개 및 32GB RAM | 20 |
Decision Optimization 교육 | 2 vCPU 및 8GB vCPU 및 16GB vCPU 및 32GB vCPU 및 64GB RAM |
6 7 9 13 |
Decision Optimization 배포 | 2 vCPU 및 8GB vCPU 및 16GB vCPU 및 32GB vCPU 및 64GB RAM |
30 40 50 60 |
Machine Learning (학습, 평가 또는 채점) |
1 vCPU 및 4GB vCPU 및 8GB vCPU 및 16GB vCPU 및 32GB vCPU 및 64GB RAM |
0.5 1 2 4 8 |
Tuning Studio ' 'watsonx 전용) |
NVIDIA A100 80GB GPU | 43 |
배치 및 프레임워크 유형별 CUH 소비량
CUH 소비량은 다음 공식을 사용하여 계산합니다.
배치 유형 | 프레임워크 | CUH 계산 |
---|---|---|
온라인 | AutoAI, AI function, 인공지능 서비스, SPSS, Scikit-Learn 사용자 정의 라이브러리, Tensorflow, RShiny | deployment_active_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_프레임워크 |
온라인 | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | 점수_지속시간_인_시간 * 노드_수_없음 * CUH_rate_for_capacity_type_프레임워크 |
일괄처리 | 모든 프레임워크 | job_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_프레임워크 |
예를 들어 15분 동안 실행되는 Decision Optimization 일괄 배포 작업을 생각해 보세요. 리소스 소비량은 다음과 같이 계산됩니다: 15분 = 0.25, 2개 노드, 2개 vCPU 및 8GB RAM 사용 시. 이 조합으로 CUH 비율은 30이 되므로 작업이 실행될 때마다 0.25 * 2 * 30, 즉 15 CUH가 소모됩니다.
이 표는 사용 유형별로 미리 정의된 머신 러닝 환경에 대한 시간당 용량 계산 단위를 보여줍니다.
모델 훈련, 평가 또는 스코어링을 위한 시간당 용량 단위
용량 유형 | 시간당 용량 단위 |
---|---|
초소형: 1 vCPU 및 4GB RAM | 0.5 |
소형: 2 vCPU 및 8GB RAM | 1 |
중간: 4 vCPU 및 16GB RAM | 2 |
대형: 8 vCPU 및 32GB RAM | 4 |
특대형: 16 vCPU 및 64GB RAM | 8 |
AutoAI 실험을 위한 시간당 용량 단위
용량 유형 | 시간당 용량 단위 |
---|---|
vCPU 8개 및 32GB RAM | 20 |
Decision Optimization 실험을 위한 시간당 용량 단위
이러한 계획은 watsonx.ai Studio에서 실행되는 Decision Optimization 실험에 적용됩니다.
용량 유형 | 시간당 용량 단위 |
---|---|
Decision Optimization: 2개의 vCPU와 8GB RAM | 6 |
Decision Optimization: 4개의 vCPU와 16GB RAM | 7 |
Decision Optimization: 8개의 vCPU 및 32GB RAM | 9 |
Decision Optimization: 16개의 vCPU와 64GB RAM | 13 |
watsonx.ai 런타임에서 Decision Optimization 위한 시간당 용량 단위
이러한 계획은 watsonx.ai 런타임에서 배포 및 실행되는 Decision Optimization 적용됩니다.
용량 유형 | 시간당 용량 단위 |
---|---|
Decision Optimization: 2개의 vCPU와 8GB RAM | 6시간에서 30분 |
Decision Optimization: 4개의 vCPU와 16GB RAM | 40 |
Decision Optimization: 8개의 vCPU 및 32GB RAM | 50 |
Decision Optimization: 16개의 vCPU와 64GB RAM | 60 |
자원 사용량 모니터링
프로젝트 또는 스페이스에서 소유하거나 공동 작업 중인 에셋의 리소스 사용량을 추적할 수 있습니다. 계정 소유자 또는 관리자인 경우 전체 계정에 대한 CUH를 추적할 수 있습니다. 자세한 내용은 계정 리소스 사용량 모니터링하기를 참조하세요.
IBM Cloud 계정 소유자 또는 관리자 또는 watsonx.ai 런타임 서비스 소유자인 경우 환경 런타임 페이지에서 계정의 런타임 사용량을 추적할 수 있습니다. 자세한 내용은 리소스 모니터링을 참조하세요.
노트북에서 머신 러닝을 위한 CUH 소비량 추적하기
노트북에서 용량 단위 시간을 계산하려면 다음을 사용하세요:
CP = client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)
예를 들어,
'capacity_units': {'current': 19773430}
19773430/(3600*1000)
5.49 CUH 리턴
자세한 내용은 IBM watsonx.ai 런타임 API 설명서의 서비스 인스턴스 섹션을 참조하세요.
자세한 정보
상위 주제: watsonx.ai 런타임 계획