0 / 0
영어 버전 문서로 돌아가기
생성 AI 자산에 대한 청구 세부 정보
마지막 업데이트 날짜: 2024년 12월 05일
생성 AI 자산에 대한 청구 세부 정보

리소스 단위(RU), 시간당 요금 또는 정액 요금을 사용하여 생성 AI 자산의 사용량을 측정하는 방법에 대해 알아보세요.

watsonx.ai 런타임으로 생성 AI 에셋으로 작업하려면 watsonx.ai 사용 중이어야 합니다. watsonx.ai.ai에 대한 자세한 내용은 IBM watsonx.ai 개요를 참조하세요.

리소스를 측정하는 방법에 대한 자세한 내용을 검토하세요:

  • watsonx.ai 제공하는 기초 모델에 대한 추론 활동을 측정하는 리소스 단위입니다.
  • watsonx.ai 가져와 배포하는 사용자 지정 파운데이션 모델에 대한 시간당 요금입니다.
  • 전용 하드웨어에 온디맨드 방식으로 배포된 선별된 파운데이션 모델의 시간당 요금입니다.
  • 문서 텍스트 추출을 위한 페이지별 정액 요금.

기초 모델을 위한 리소스 단위 측정

지원되는 파운데이션 모델 및 가격 목록은 지원되는 파운데이션 모델을 참조하세요. 지원되는 인코더 모델 목록과 가격은 지원되는 인코더 모델을 참조하세요.

리소스 단위(RU)는 foundation model 추론의 입력과 출력에서 나온 토큰 1000개에 해당합니다. 토큰은 foundation model 프롬프트의 입력 또는 출력 또는 임베딩 모델 입력에 사용되는 텍스트의 기본 단위(일반적으로 4자 또는 0.75 )입니다.

IBM watsonx.ai 제공하는 각 foundation model 입력 및 출력에 대한 추론 가격이 할당됩니다. 가격은 RU의 기본 가격($0.0.0001)의 배수로 결정됩니다. 예를 들어 가격이 $0.0.0006 모델의 승수는 기본 요율의 6배입니다.

중요: 모델에 제출되는 초당 추론 요청 수에는 요금제별로 제한이 있습니다. 사용자가 추론 요청 한도를 초과하는 경우 시스템 알림을 통해 안내를 받을 수 있습니다.

즉시 조정된 foundation model 기본 foundation model 동일한 가격이 할당됩니다. 튜닝된 파운데이션 모델에 대한 자세한 내용은 Tuning Studio 참조하세요. Tuning Studio 모델을 튜닝하면 CUH(용량 단위 시간)가 소모됩니다. 자세한 내용은 머신 러닝 자산에 대한 청구 세부 정보를 참조하세요.

모델별 리소스 단위 요금 계산하기

foundation model 추론에 대한 요금을 계산하려면 한 달 동안 소비한 총 토큰 수를 1000으로 나눈 다음 가장 가까운 1000으로 반올림하여 총 RU 수를 구합니다. 총 RU 수에 모델 가격을 곱하여 총 사용 요금을 구합니다. 모델 가격은 모델마다 다르며, 특정 모델의 입력 또는 출력 토큰에 따라 달라질 수도 있습니다.

기본 공식은 다음과 같습니다:

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

RU의 기본 가격은 $0.0.0001. 각 foundation model 가격은 기본 가격의 배수입니다.

승수별 청구 클래스

watsonx.ai API로 모델 사용을 모니터링하는 경우, 모델 가격은 다음과 같이 가격 책정 단계별로 나열됩니다:

테이블 1. API 가격 계층
모델 가격 계층 RU당 가격(USD) 승수
기본 요율
클래스 1 $0.0006 6
클래스 2 $0.0018 18
클래스 3 $0.0050 50
클래스 C1 $0.0001 1
클래스 5 $0.00025 2.5
클래스 7 $0.016 160
클래스 8 $0.00015 1.5
클래스 9 $0.00035 3.5
클래스 10 $0.0020 20
클래스 11 $0.000005 0.05
클래스 12 $0.0002 2
참고:

Mistral Large 등 특정 모델에는 승수가 지정되지 않은 특별 가격이 적용됩니다. 가격은 지원되는 모델에 나와 있습니다.

사용자 지정 파운데이션 모델에 대한 시간당 청구 요금

사용자 지정 파운데이션 모델을 배포하려면 Standard 플랜이 필요합니다.

청구 요금은 모델 하드웨어 구성에 따라 다르며 모델 호스팅 및 추론에 적용됩니다. 모델이 성공적으로 배포되면 요금이 부과되기 시작하여 모델이 삭제될 때까지 계속됩니다.

테이블 2. 사용자 지정 foundation model 청구 요금
구성 규모 시간당 청구 요금(USD)
소형 $5.22
중간 $10.40
대형 $20.85
중요: 계정당 최대 4개의 작은 사용자 지정 기초 모델, 2개의 중간 모델 또는 1개의 큰 모델을 배포할 수 있습니다.

사용자 지정 foundation model 대한 구성을 선택하는 방법에 대한 자세한 내용은 사용자 지정 foundation model 배포 계획을 참조하세요.

온디맨드 배포 모델의 시간당 청구 요금

조직에서 독점적으로 사용할 수 있도록 예약된 호스팅 솔루션을 원하는 경우 온디맨드 방식으로 파운데이션 모델을 배포하세요. 배포에 대한 액세스 권한을 부여한 동료만 foundation model 추론할 수 있습니다. 전용 배포는 더 빠르고 반응이 빠른 상호작용을 의미하며, 더 큰 컨텍스트 창 길이의 프롬프트를 허용합니다. 청구 요금은 모델별로 설정되며 호스팅 및 모델 추론에 적용됩니다. 요금 청구는 모델이 배포될 때 시작되며 모델이 삭제될 때까지 계속됩니다.

참고: 필요에 따라 파운데이션 모델을 배포하려면 표준 요금제가 필요합니다. 이 기능은 현재 달라스 데이터 센터에서만 사용할 수 있습니다.

가격을 포함하여 온디맨드 foundation model 배포에 대한 자세한 내용은 watsonx.ai 지원되는 기반 모델을 참조하세요.

문서 텍스트 추출을 위한 페이지당 요금

watsonx.ai REST API의 문서 텍스트 추출 방법을 사용하여 고도로 구조화되고 다이어그램과 표를 사용하여 정보를 전달하는 PDF 파일을 AI 모델 친화적인 JSON 파일 형식으로 변환할 수 있습니다. 자세한 내용은 문서에서 텍스트 추출하기를 참조하세요.

청구는 처리된 페이지당 정액 요금으로 청구됩니다. 페이지는 텍스트 페이지(최대 1800자), 이미지 또는 .tiff 프레임일 수 있습니다. 청구 요금은 요금제 유형에 따라 다릅니다.

테이블 3. 텍스트 추출 가격
계획 유형 페이지당 가격(USD)
Essential $0.038
표준 $0.030

자세히 알아보기

상위 주제: watsonx.ai 런타임 계획

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기