리소스 단위(RU), 시간당 요금 또는 정액 요금을 사용하여 생성 AI 자산의 사용량을 측정하는 방법에 대해 알아보세요.
watsonx.ai 런타임으로 생성 AI 에셋으로 작업하려면 watsonx.ai 사용 중이어야 합니다. watsonx.ai.ai에 대한 자세한 내용은 IBM watsonx.ai 개요를 참조하세요.
리소스를 측정하는 방법에 대한 자세한 내용을 검토하세요:
watsonx.ai 에서 제공하는 기초 모델의 추론 활동을 측정하는 리소스 단위.
watsonx.ai 가져와 배포하는 사용자 지정 파운데이션 모델에 대한 시간당 요금입니다.
전용 하드웨어에 온디맨드 방식으로 배포된 선별된 파운데이션 모델의 시간당 요금입니다.
문서 텍스트 추출을 위한 페이지별 정액 요금.
자원 단위는 다음 자원을 측정하는 데 사용됩니다
foundation model 를 추론하여 텍스트 또는 텍스트 임베딩을 생성하는 데 사용되는 토큰입니다.
미래 값을 예측하기 위해 시계열 foundation model 에 사용되는 데이터 포인트.
추론 기반 모델의 자원 단위 측정
Copy link to section
텍스트 생성을 위한 지원되는 기초 모델과 해당 가격 목록은 지원되는 기초 모델을 참조하세요. 텍스트 임베딩을 재순위 지정하고 생성하는 데 지원되는 인코더 모델과 해당 가격 목록은 지원되는 인코더 모델을 참조하세요.
foundation model 의 추론을 측정할 때, Resource Unit(RU)는 foundation model 의 입력과 출력에서 1,000 토큰과 같습니다. 토큰은 입력 또는 출력에 사용되는 텍스트의 기본 단위(일반적으로 4자 또는 0.75 단어)로, foundation model 프롬프트 또는 임베딩 모델에 대한 입력으로 사용됩니다.
IBM watsonx.ai 제공하는 각 foundation model 입력 및 출력에 대한 추론 가격이 할당됩니다. 가격은 RU의 기본 가격($0.0.0001)의 배수로 결정됩니다. 예를 들어 가격이 $0.0.0006 모델의 승수는 기본 요율의 6배입니다.
중요: 모델에 제출되는 초당 추론 요청 수에는 요금제별로 제한이 있습니다. 사용자가 추론 요청 한도를 초과하는 경우 시스템 알림을 통해 안내를 받을 수 있습니다.
즉시 조정된 foundation model 기본 foundation model 동일한 가격이 할당됩니다. 튜닝된 파운데이션 모델에 대한 자세한 내용은 Tuning Studio 참조하세요. Tuning Studio 모델을 튜닝하면 CUH(용량 단위 시간)가 소모됩니다. 자세한 내용은 머신 러닝 자산에 대한 청구 세부 정보를 참조하세요.
시계열 기초 모델 추론에 대한 자원 단위 측정
Copy link to section
foundation model 예측을 측정할 때, Resource Unit(RU)는 foundation model 입력 및 출력에서 1,000개의 데이터 포인트와 같습니다. 데이터 포인트는 하나 이상의 숫자로 표현되는 입력 및 출력 콘텐츠의 단위입니다.
승수별 청구 클래스
Copy link to section
watsonx.ai API로 모델 사용을 모니터링하는 경우, 모델 가격은 다음과 같이 가격 책정 단계별로 나열됩니다:
테이블 1. API 가격 계층
모델 가격 계층
자원 유형
RU당 가격(USD)
승수 기본 요율
클래스 1
토큰
$0.0006
6
클래스 2
토큰
$0.0018
18
클래스 3
토큰
$0.0050
50
클래스 C1
토큰
$0.0001
1
클래스 5
토큰
$0.00025
2.5
클래스 7
토큰
$0.016
160
클래스 8
토큰
$0.00015
1.5
클래스 9
토큰
$0.00035
3.5
클래스 10
토큰
$0.0020
20
클래스 11
토큰
$0.000005
0.05
클래스 12
토큰
$0.0002
2
13급
토큰
$0.00071
7.1
14급
데이터 포인트
$0.00013
1.3
15급
데이터 포인트
$0.00038
3.8
참고:
Mistral Large 등 특정 모델에는 승수가 지정되지 않은 특별 가격이 적용됩니다. 가격은 지원되는 모델에 나와 있습니다.
모델당 토큰의 자원 단위 요율 계산
Copy link to section
foundation model 추론에 대한 요금을 계산하려면 한 달 동안 소비한 총 토큰 수를 1000으로 나눈 다음 가장 가까운 1000으로 반올림하여 총 RU 수를 구합니다. 총 RU 수에 모델 가격을 곱하여 총 사용 요금을 구합니다. 모델 가격은 모델마다 다르며, 특정 모델의 입력 또는 출력 토큰에 따라 달라질 수도 있습니다.
기본 공식은 다음과 같습니다:
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
RU의 기본 가격은 $0.0.0001. 각 foundation model 가격은 기본 가격의 배수입니다.
모델당 데이터 포인트의 자원 단위 비율 계산
Copy link to section
foundation model 시간 시리즈 예측에 대한 요금을 계산하려면 다음 공식을 사용하십시오
입력 계산: context length x number of series x number of channels
산출량 계산: prediction length x number of series x number of channels
이 방정식들은 다음의 변수들을 사용합니다:
컨텍스트 길이는 시계열 foundation model 이 예측을 위해 입력으로 사용하는 과거 데이터 포인트의 수를 의미합니다.
시리즈는 시간이 지남에 따라 순차적으로 이루어진 관찰의 모음입니다. 예를 들어, 여러 회사의 주가를 비교할 때, 각 회사의 관찰된 주가 이력은 별도의 시리즈입니다.
조직에서 독점적으로 사용할 수 있도록 예약된 호스팅 솔루션을 원하는 경우 온디맨드 방식으로 파운데이션 모델을 배포하세요. 배포에 대한 액세스 권한을 부여한 동료만 foundation model 추론할 수 있습니다. 전용 배포는 더 빠르고 반응이 빠른 상호작용을 의미하며, 더 큰 컨텍스트 창 길이의 프롬프트를 허용합니다. 청구 요금은 모델별로 설정되며 호스팅 및 모델 추론에 적용됩니다. 요금 청구는 모델이 배포될 때 시작되며 모델이 삭제될 때까지 계속됩니다.