AutoAI 모델을 학습하거나, 머신 러닝 모델을 실행하거나, 배포된 모델의 점수를 매길 때 CUH(용량 단위 시간)로 측정되는 watsonx.ai 런타임 리소스를 사용합니다. 기초 모델로 추론 서비스를 실행할 때 소비된 토큰 또는 시간당 요금으로 측정되는 watsonx.ai 런타임 리소스를 사용합니다. 이 주제에서는 선택할 수 있는 다양한 계획, 포함되는 서비스 및 컴퓨팅 자원을 계산하는 방법에 대해 설명합니다.
watsonx.ai Runtime in Cloud Pak for Data as a Service and watsonx
' watsonx.ai 런타임 플랜에는 ' watsonx.ai' 에 대한 세부 정보가 포함되어 있습니다. Watsonx.ai 는 생성 AI에 대한 작업을 수행하기 위한 통합 도구의 스튜디오이며, 기반 모델 및 머신 러닝 모델로 구동됩니다. Cloud Pak for Data as a Service를 사용하는 경우, 자원 단위를 사용하는 측정 프롬프트 추론 및 기초 모델에 대한 작업의 세부사항은 사용자의 플랜에 적용되지 않습니다.
watsonx 및 Cloud Pak for Data as a Service모두에 대해 사용으로 설정된 경우 두 플랫폼 간에 전환할 수 있습니다.
watsonx.ai 런타임 플랜 선택하기
watsonx.ai 런타임 플랜은 ' watsonx.ai ' 런타임으로 훈련 및 배포하는 모델과 기초 모델에 사용하는 프롬프트에 대한 요금 청구 방식을 관리합니다. 필요에 따라 플랜을 선택하십시오.
- Lite는 용량이 제한된 무료 계획입니다. watsonx.ai Runtime을 평가하고 기능을 체험해 보고 싶은 경우 이 플랜을 선택하세요. Lite 플랜은 watsonx에서 기본 모델 튜닝 실험 실행을 지원하지 않습니다.
- 필수사항 은 사용자의 요구에 맞게 모델을 빌드, 배치 및 관리할 수 있는 유연성을 제공하는 종량과금제 플랜입니다.
- 표준 은 조직의 모든 기계 학습 요구사항을 지원하도록 설계된 고용량 엔터프라이즈 플랜입니다. 용량 단위 시간은 정액 요금으로 제공되는 반면, 자원 단위 이용은 종량제로 제공됩니다.
리소스 소비 추적 방법
측정 및 청구 목적으로 머신 러닝 모델과 배포 또는 기반 모델은 이러한 요금 메트릭을 사용하여 측정됩니다:
CUH(용량 단위 시간 )는 사용량 및 청구 목적으로 단위 시간당 컴퓨팅 리소스 소비량을 측정합니다. CUH는 기초 모델 추론을 제외한 모든 watsonx.ai 런타임 활동을 측정합니다.
RU(리소스 단위 )는 기초 모델 추론 소비를 측정합니다. 추론은 프롬프트에 대한 응답으로 출력을 생성하기 위해 기초 모델을 호출하는 프로세스입니다. 각 RU는 1,000개 토큰과 같습니다. 토큰은 기초 모델 프롬프트의 입력 또는 출력에 사용되는 기본 텍스트 단위 (일반적으로 4자또는 0.75 단어) 입니다.
시간당 요금 은 watsonx.ai 가져와 배포하는 사용자 지정 파운데이션 모델에 대한 요금을 계산하는 데 사용됩니다. 요금은 구성 규모에 따라 결정되며 모델 배포 기간 동안 청구됩니다.
페이지 요금은 문서 텍스트 추출에 대한 요금을 계산하는 데 사용됩니다. 페이지 요금은 요금제별로 설정됩니다.
리소스 소비량 측정 기준은 무엇인가요?
용량 단위 시간 (CUH) 또는 자원 단위 (RU) 로 측정된 자원은 도구에서 작업하는 데 사용되지 않고 실행 중인 자산에 사용됩니다. 즉, 실험을 정의하는 데에는 소비 비용이 없습니다.AutoAI, 하지만 실험 파이프라인을 교육하기 위해 실험을 실행하는 데에는 요금이 부과됩니다. 마찬가지로 배치 영역을 작성하거나 배치 작업을 정의하는 데는 비용이 부과되지 않지만 배치 작업을 실행하거나 배치된 자산에 대해 추론하는 데는 비용이 부과됩니다. Jupyter 노트북, RStudio 에셋, Bash 스크립트 및 사용자 지정 모델 배포와 같이 지속적으로 실행되는 에셋은 활성화되어 있는 동안 리소스를 소비합니다.
watsonx.ai 런타임 플랜 세부 정보
Lite 플랜은 watsonx.ai의 기능을 평가할 수 있도록 충분한 무료 리소스를 제공합니다. 그런 다음 계획 기능 및 용량을 기반으로 조직의 요구사항과 일치하는 유료 계획을 선택할 수 있습니다.
기능 계획 | Lite | 필수 | 표준 |
---|---|---|---|
cUH에서 watsonx.ai 런타임 사용량 | 매월 20 CUH | CUH 비율을 기반으로 한 CUH 청구에 소비 시간을 곱한 값 | 매월 2500 CUH |
토큰 또는 자원 단위 (RU) 에서 기초 모델 추론 | 매월 50 ,000개 토큰 | 사용량에 대해 청구됨 (1000개의 토큰 = 1 RU) | 사용량에 대해 청구됨 (1000개의 토큰 = 1 RU) |
배치당 최대 병렬 Decision Optimization 일괄처리 작업 | 2 | 5 | 100년 |
공간별로 유지되는 배치 작업 | 100년 | 1000 | 3000 |
유휴 배치 시간 | 1일 | 3일 | 3일 |
HIPAA 지원 | 해당사항 없음 | 해당사항 없음 | 댈러스 지역만 IBM Cloud 계정에서 사용으로 설정되어야 함 |
플랜 ID당 비율 한계 | 초당 2개의 추론 요청 | 초당 8개의 추론 요청 | 초당 8개의 추론 요청 |
맞춤형 기초 모델 지원 | 사용할 수 없음 | 사용할 수 없음 | 구성에 따른 시간당 청구 |
문서 텍스트 추출 | 사용할 수 없음 | 페이지당 청구 | 페이지당 청구 |
watsonx.ai 런타임 가격 세부 정보
청구 요금 및 리소스 소비량 계산 방법에 대한 자세한 내용은 다음을 참조하세요:
자세한 정보
- 생성 AI 자산에 대한 청구 세부 정보
- 머신 러닝 자산에 대한 청구 세부 정보
- 컴퓨팅 리소스 할당 및 사용량 추적에 대한 자세한 내용은 런타임 사용량을 참조하세요.
상위 주제: watsonx.ai 런타임