리소스 단위(RU), 시간당 요금 또는 정액 요금을 사용하여 생성 AI 자산의 사용량을 측정하는 방법에 대해 알아보세요.
watsonx.ai 런타임으로 생성 AI 에셋으로 작업하려면 watsonx.ai 사용 중이어야 합니다. watsonx.ai.ai에 대한 자세한 내용은 IBM watsonx.ai 개요를 참조하세요.
리소스를 측정하는 방법에 대한 자세한 내용을 검토하세요:
- watsonx.ai 에서 제공하는 기초 모델의 추론 활동을 측정하는 리소스 단위.
- watsonx.ai 가져와 배포하는 사용자 지정 파운데이션 모델에 대한 시간당 요금입니다.
- 전용 하드웨어에 온디맨드 방식으로 배포된 선별된 파운데이션 모델의 시간당 요금입니다.
- 문서 텍스트 추출을 위한 페이지별 정액 요금.
자원 단위는 다음 자원을 측정하는 데 사용됩니다
- foundation model 를 추론하여 텍스트 또는 텍스트 임베딩을 생성하는 데 사용되는 토큰입니다.
- 미래 값을 예측하기 위해 시계열 foundation model 에 사용되는 데이터 포인트.
추론 기반 모델의 자원 단위 측정
텍스트 생성을 위한 지원되는 기초 모델과 해당 가격 목록은 지원되는 기초 모델을 참조하세요. 텍스트 임베딩을 재순위 지정하고 생성하는 데 지원되는 인코더 모델과 해당 가격 목록은 지원되는 인코더 모델을 참조하세요.
foundation model 의 추론을 측정할 때, Resource Unit(RU)는 foundation model 의 입력과 출력에서 1,000 토큰과 같습니다. 토큰은 입력 또는 출력에 사용되는 텍스트의 기본 단위(일반적으로 4자 또는 0.75 단어)로, foundation model 프롬프트 또는 임베딩 모델에 대한 입력으로 사용됩니다.
IBM watsonx.ai 제공하는 각 foundation model 입력 및 출력에 대한 추론 가격이 할당됩니다. 가격은 RU의 기본 가격($0.0.0001)의 배수로 결정됩니다. 예를 들어 가격이 $0.0.0006 모델의 승수는 기본 요율의 6배입니다.
즉시 조정된 foundation model 기본 foundation model 동일한 가격이 할당됩니다. 튜닝된 파운데이션 모델에 대한 자세한 내용은 Tuning Studio 참조하세요. Tuning Studio 모델을 튜닝하면 CUH(용량 단위 시간)가 소모됩니다. 자세한 내용은 머신 러닝 자산에 대한 청구 세부 정보를 참조하세요.
시계열 기초 모델 추론에 대한 자원 단위 측정
foundation model 예측을 측정할 때, Resource Unit(RU)는 foundation model 입력 및 출력에서 1,000개의 데이터 포인트와 같습니다. 데이터 포인트는 하나 이상의 숫자로 표현되는 입력 및 출력 콘텐츠의 단위입니다.
승수별 청구 클래스
watsonx.ai API로 모델 사용을 모니터링하는 경우, 모델 가격은 다음과 같이 가격 책정 단계별로 나열됩니다:
모델 가격 계층 | 자원 유형 | RU당 가격(USD) | 승수 기본 요율 |
---|---|---|---|
클래스 1 | 토큰 | $0.0006 | 6 |
클래스 2 | 토큰 | $0.0018 | 18 |
클래스 3 | 토큰 | $0.0050 | 50 |
클래스 C1 | 토큰 | $0.0001 | 1 |
클래스 5 | 토큰 | $0.00025 | 2.5 |
클래스 7 | 토큰 | $0.016 | 160 |
클래스 8 | 토큰 | $0.00015 | 1.5 |
클래스 9 | 토큰 | $0.00035 | 3.5 |
클래스 10 | 토큰 | $0.0020 | 20 |
클래스 11 | 토큰 | $0.000005 | 0.05 |
클래스 12 | 토큰 | $0.0002 | 2 |
13급 | 토큰 | $0.00071 | 7.1 |
14급 | 데이터 포인트 | $0.00013 | 1.3 |
15급 | 데이터 포인트 | $0.00038 | 3.8 |
Mistral Large 등 특정 모델에는 승수가 지정되지 않은 특별 가격이 적용됩니다. 가격은 지원되는 모델에 나와 있습니다.
모델당 토큰의 자원 단위 요율 계산
foundation model 추론에 대한 요금을 계산하려면 한 달 동안 소비한 총 토큰 수를 1000으로 나눈 다음 가장 가까운 1000으로 반올림하여 총 RU 수를 구합니다. 총 RU 수에 모델 가격을 곱하여 총 사용 요금을 구합니다. 모델 가격은 모델마다 다르며, 특정 모델의 입력 또는 출력 토큰에 따라 달라질 수도 있습니다.
기본 공식은 다음과 같습니다:
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
RU의 기본 가격은 $0.0.0001. 각 foundation model 가격은 기본 가격의 배수입니다.
모델당 데이터 포인트의 자원 단위 비율 계산
foundation model 시간 시리즈 예측에 대한 요금을 계산하려면 다음 공식을 사용하십시오
- 입력 계산:
context length x number of series x number of channels
- 산출량 계산:
prediction length x number of series x number of channels
이 방정식들은 다음의 변수들을 사용합니다:
- 컨텍스트 길이는 시계열 foundation model 이 예측을 위해 입력으로 사용하는 과거 데이터 포인트의 수를 의미합니다.
- 시리즈는 시간이 지남에 따라 순차적으로 이루어진 관찰의 모음입니다. 예를 들어, 여러 회사의 주가를 비교할 때, 각 회사의 관찰된 주가 이력은 별도의 시리즈입니다.
- 채널은 시계열 데이터 세트 내에서 측정되는 특정 기능 또는 변수입니다.
- 예측 길이는 모델이 예측할 미래 데이터 포인트의 수입니다.
이 값에 대한 자세한 정보는 미래 데이터 값 예측하기를 참고하세요.
자원 유형 | 모델 가격 계층 | 루블당 미화 가격 |
---|---|---|
입력 데이터 포인트 | 14급 | $0.00013 |
출력 데이터 포인트 | 15급 | $0.00038 |
다음 예는 다음과 같은 매개 변수를 사용하여 시계열 예측 요청에 대한 비용을 계산하는 방법을 보여줍니다
매개변수 | 예시 수량 |
---|---|
컨텍스트 길이( granite-ttm-1536-96-r2 모델) | 1,536 |
채널 | 1,000만 |
계열 | 1,000시간 |
예측 길이 | 96 |
총 입력 데이터 포인트: 15,360,000 (컨텍스트 길이 1,536, 10개 채널, 1,000개 시리즈)
15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
총 출력 데이터 포인트: 960,000 (1,000 시리즈에 대한 96개의 시간 포인트, 10개의 채널 예측)
960,000 / 1,000 = 960 x 0.00038 = 0.3648
시계열 예측 요청에 대한 총 가격: $ 2.36 (입력 비용 $ 1.9968 + 출력 비용 $ 0.3648 )
1.9968 + 0.3648 = 2.3616
사용자 지정 파운데이션 모델에 대한 시간당 청구 요금
사용자 지정 파운데이션 모델을 배포하려면 Standard 플랜이 필요합니다.
청구 요금은 모델 하드웨어 구성에 따라 다르며 모델 호스팅 및 추론에 적용됩니다. 모델이 성공적으로 배포되면 요금이 부과되기 시작하여 모델이 삭제될 때까지 계속됩니다.
구성 규모 | 시간당 청구 요금(USD) |
---|---|
소형 | $5.22 |
중간 | $10.40 |
대형 | $20.85 |
사용자 지정 foundation model 대한 구성을 선택하는 방법에 대한 자세한 내용은 사용자 지정 foundation model 배포 계획을 참조하세요.
온디맨드 배포 모델의 시간당 청구 요금
조직에서 독점적으로 사용할 수 있도록 예약된 호스팅 솔루션을 원하는 경우 온디맨드 방식으로 파운데이션 모델을 배포하세요. 배포에 대한 액세스 권한을 부여한 동료만 foundation model 추론할 수 있습니다. 전용 배포는 더 빠르고 반응이 빠른 상호작용을 의미하며, 더 큰 컨텍스트 창 길이의 프롬프트를 허용합니다. 청구 요금은 모델별로 설정되며 호스팅 및 모델 추론에 적용됩니다. 요금 청구는 모델이 배포될 때 시작되며 모델이 삭제될 때까지 계속됩니다.
foundation model 의 온디맨드 배포에 대한 자세한 내용(가격 포함)은 watsonx.ai 의 지원되는 기초 모델에서 확인하실 수 있습니다.
문서 텍스트 추출을 위한 페이지당 요금
watsonx.ai REST API의 문서 텍스트 추출 방법을 사용하여 고도로 구조화되고 다이어그램과 표를 사용하여 정보를 전달하는 PDF 파일을 AI 모델 친화적인 JSON 파일 형식으로 변환할 수 있습니다. 자세한 내용은 문서에서 텍스트 추출하기를 참조하세요.
청구는 처리된 페이지당 정액 요금으로 청구됩니다. 페이지는 텍스트 페이지(최대 1800자), 이미지 또는 .tiff 프레임일 수 있습니다. 청구 요금은 요금제 유형에 따라 다릅니다.
계획 유형 | 페이지당 가격(USD) |
---|---|
Essential | $0.038 |
표준 | $0.030 |
자세히 알아보기
- 머신 러닝 자산의 가격에 대한 자세한 내용은 머신 러닝 자산의 청구 요금을 참조하세요.
- 컴퓨팅 자원 할당 및 소비 추적에 대한 자세한 내용은 런타임 사용량을 참조하십시오.
- 각 모델에 대한 자세한 내용은 지원되는 파운데이션 모델을 참조하세요.
- 각 모델의 지역 지원에 대한 자세한 내용은 기초 모델의 지역 지원 가능 여부를 참조하십시오.
상위 주제: watsonx.ai 런타임 계획