모델이나 기능을 훈련하거나 스코어링하면, 사용자 컴퓨팅 요구에 일치하는 하드웨어 구성의 유형, 크기 및 성능을 선택합니다.
기본 하드웨어 구성
에셋을 학습시킬 때 또는 배포할 때 watsonx.ai 런타임 에셋의 하드웨어 구성을 선택하세요.
용량 유형 | 시간당 용량 단위 |
---|---|
초소형: 1x4 = 1개의 vCPU와 4GB RAM | 0.5 |
소형: 2x8 = 2개의 vCPU와 8GB RAM | 1 |
중형: 4x16 = 4개의 vCPU와 16GB RAM | 2 |
대형: 8x32 = 8개의 vCPU와 32GB RAM | 4 |
초대형: 16x64 = 16개의 vCPU와 64GB RAM | 8 |
watsonx.ai 런타임 에셋의 계산 사용량
배포 및 채점은 watsonx.ai 런타임 서비스의 컴퓨팅 리소스를 CUH(용량 단위 시간)로 소비합니다.
watsonx.ai 런타임 서비스의 월간 총 CUH 사용량을 확인하려면 탐색 메뉴에서 관리 -> 환경 런타임을 선택합니다.
또한 각 특정 배치 영역에서 월별 자원 사용량을 모니터할 수 있습니다. 이를 수행하려면 배치 영역에서 관리 탭으로 이동한 후 자원 사용을 선택하십시오. 요약은 배치 유형별로 사용되는 CUH를 표시합니다. AutoAI 배치, 연합 학습 배치, 일괄처리 배치 및 온라인 배치의 경우 별도로 표시됩니다.
컴퓨팅 사용량 상세 정보
이용되는 CUH의 비율은 배치의 컴퓨팅 요구사항에 따라 결정됩니다. 이는 다음과 같은 변수를 기반으로 합니다.
- 배치 유형
- 프레임워크 유형
- 더 많은 동시 사용자 및 요청을 지원하기 위해 배치를 스케일링하는 복잡도 또한 CUH 이용을 증가시킵니다. 많은 변수가 배치의 자원 이용에 영향을 주므로 모델 및 배치에서 테스트를 실행하여 CUH 이용을 분석하는 것이 좋습니다.
온라인 배치가 용량 단위를 소모하는 방식은 프레임워크에 기반합니다. 일부 프레임워크의 경우 CUH는 배치 자산이 배치 영역에서 활성 상태인 시간에 대해 비용이 청구됩니다. 예를 들어, SPSS 모델은 온라인 배치 모드에서 하루 24시간, 일주일에 7일동안 실행되며 CUH를 이용하고 해당 기간에 대해 비용이 청구됩니다. 활성 온라인 배치에는 유휴 시간이 없습니다. 기타 프레임워크의 경우, CUH는 스코어링 지속 기간에 따라 청구됩니다. CUH 사용 계산 방법에 대한 세부사항은 CUH 이용 테이블을 참조하십시오.
계산 시간은 밀리초로 계산되며 각 구별 조작에 대해 최소 1분으로 계산됩니다. 예를 들어,
- 12초가 소요되는 훈련 실행은 1분으로 청구됩니다.
- 83.555 초가 소요되는 훈련 실행은 계산된 대로 정확하게 청구됩니다.
배치 및 프레임워크 유형별 CUH 소비량
CUH 이용은 다음 공식을 사용하여 계산됩니다.
배치 유형 | 프레임워크 | CUH 계산 |
---|---|---|
온라인 | AutoAI, AI 기능, SPSS, Scikit-Learn 사용자 정의 라이브러리, Tensorflow, RShiny | 용량 유형 프레임워크에 대한 배치 활성 지속 기간 * 노드 수 * CUH 비율 |
온라인 | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | 용량 유형 프레임워크에 대한 점수 지속 기간 (초) * 노드 수 * CUH 비율 |
일괄처리 | 모든 프레임워크 | 용량 유형 프레임워크에 대한 작업 지속 기간 (초) * 노드 수 * CUH 비율 |
자세히 알아보기
상위 주제: 예측 배치 관리