리소스 단위(RU), 시간당 요금 또는 정액 요금을 사용하여 생성 AI 자산의 사용량을 측정하는 방법에 대해 알아보세요.
watsonx.ai 런타임으로 생성 AI 에셋으로 작업하려면 watsonx.ai 사용 중이어야 합니다. IBM watsonx.ai 개요.
리소스를 측정하는 방법에 대한 자세한 내용을 검토하세요:
- watsonx.ai 제공하는 기초 모델에 대한 추론 활동을 측정하는 리소스 단위입니다.
- watsonx.ai 가져와 배포하는 사용자 지정 파운데이션 모델에 대한 시간당 요금입니다.
- 전용 하드웨어에 온디맨드 방식으로 배포된 선별된 파운데이션 모델의 시간당 요금입니다.
- 문서 텍스트 추출을 위한 페이지별 정액 요금.
기초 모델을 위한 리소스 단위 측정
지원되는 파운데이션 모델 및 가격 목록은 지원되는 파운데이션 모델을 참조하세요. 지원되는 인코더 모델 목록과 가격은 지원되는 인코더 모델을 참조하세요.
리소스 단위(RU)는 기초 모델 추론의 입력과 출력에서 나온 토큰 1000개에 해당합니다. 토큰은 기초 모델 프롬프트의 입력 또는 출력 또는 임베딩 모델에 대한 입력에 사용되는 기본 텍스트 단위(일반적으로 4자 또는 0.75 )입니다.
IBM watsonx.ai 제공하는 각 기초 모델에는 입력 및 출력에 대한 추론 가격이 할당됩니다. 가격은 RU의 기본 가격($0.0.0001)의 배수로 결정됩니다. 예를 들어 가격이 $0.0.0006 모델의 승수는 기본 요율의 6배입니다.
즉시 조정된 파운데이션 모델에는 기본 파운데이션 모델과 동일한 가격이 할당됩니다. 튜닝된 파운데이션 모델에 대한 자세한 내용은 Tuning Studio 참조하세요. Tuning Studio 모델을 튜닝하면 CUH(용량 단위 시간)가 소모됩니다. 자세한 내용은 머신 러닝 자산에 대한 청구 세부 정보를 참조하세요.
모델별 리소스 단위 요금 계산하기
기초 모델 추론에 대한 요금을 계산하려면 한 달 동안 소비한 총 토큰 수를 1000으로 나눈 다음 가장 가까운 1000으로 반올림하여 총 RU 수를 구합니다. 총 RU 수에 모델 가격을 곱하여 총 사용 요금을 구합니다. 모델 가격은 모델마다 다르며, 특정 모델의 입력 또는 출력 토큰에 따라 달라질 수도 있습니다.
기본 공식은 다음과 같습니다:
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
RU의 기본 가격은 $0.0.0001. 각 파운데이션 모델의 가격은 기본 가격의 배수입니다.
승수별 청구 클래스
watsonx.ai API로 모델 사용을 모니터링하는 경우, 모델 가격은 다음과 같이 가격 책정 단계별로 나열됩니다:
모델 가격 계층 | RU당 가격(USD) | 승수 기본 요율 |
---|---|---|
클래스 1 | $0.0006 | 6 |
클래스 2 | $0.0018 | 18 |
클래스 3 | $0.0050 | 50 |
클래스 C1 | $0.0001 | 1 |
클래스 5 | $0.00025 | 2.5 |
클래스 7 | $0.016 | 160 |
클래스 8 | $0.00015 | 1.5 |
클래스 9 | $0.00035 | 3.5 |
클래스 10 | $0.0020 | 20 |
11학년 | $0.000005 | 0.05 |
12학년 | $0.0002 | 2 |
미스트랄 라지 등 특정 모델에는 승수가 지정되지 않은 특별 가격이 적용됩니다. 가격은 지원되는 모델에 나와 있습니다.
사용자 지정 파운데이션 모델에 대한 시간당 청구 요금
사용자 지정 파운데이션 모델을 배포하려면 Standard 플랜이 필요합니다.
청구 요금은 모델 하드웨어 구성에 따라 다르며 모델 호스팅 및 추론에 적용됩니다. 모델이 성공적으로 배포되면 요금이 부과되기 시작하여 모델이 삭제될 때까지 계속됩니다.
구성 규모 | 시간당 청구 요금(USD) |
---|---|
소형 | $5.22 |
중간 | $10.40 |
대형 | $20.85 |
사용자 지정 기초 모델에 대한 구성을 선택하는 방법에 대한 자세한 내용은 사용자 지정 기초 모델 배포 계획을 참조하세요.
온디맨드 배포 모델의 시간당 청구 요금
조직에서 독점적으로 사용할 수 있도록 예약된 호스팅 솔루션을 원하는 경우 온디맨드 방식으로 파운데이션 모델을 배포하세요. 배포에 대한 액세스 권한을 부여한 동료만 기초 모델을 추론할 수 있습니다. 전용 배포는 더 빠르고 반응이 빠른 상호작용을 의미하며, 더 큰 컨텍스트 창 길이의 프롬프트를 허용합니다. 청구 요금은 모델별로 설정되며 호스팅 및 모델 추론에 적용됩니다. 요금 청구는 모델이 배포될 때 시작되며 모델이 삭제될 때까지 계속됩니다.
가격을 포함하여 온디맨드 파운데이션 모델 배포에 대한 자세한 내용은 watsonx.ai 지원되는 파운데이션 모델을 참조하세요.
문서 텍스트 추출을 위한 페이지당 요금
watsonx.ai REST API의 문서 텍스트 추출 방법을 사용하여 고도로 구조화되고 다이어그램과 표를 사용하여 정보를 전달하는 PDF 파일을 AI 모델 친화적인 JSON 파일 형식으로 변환할 수 있습니다.
청구는 처리된 페이지당 정액 요금으로 청구됩니다. 페이지는 텍스트 페이지(최대 1800자), 이미지 또는 .tiff 프레임일 수 있습니다. 청구 요금은 요금제 유형에 따라 다릅니다.
계획 유형 | 페이지당 가격(USD) |
---|---|
Essential | $0.038 |
표준 | $0.030 |
자세한 정보
- 머신 러닝 자산의 가격에 대한 자세한 내용은 머신 러닝 자산의 청구 요금을 참조하세요.
- 컴퓨팅 리소스 할당 및 사용량 추적에 대한 자세한 내용은 런타임 사용량을 참조하세요.
- 각 모델에 대한 자세한 내용은 지원되는 파운데이션 모델을 참조하세요.
- 각 모델에 대한 지역별 지원에 대한 자세한 내용은 기초 모델의 지역별 가용성을 참조하세요.
상위 주제: watsonx.ai 런타임 계획