watsonx.ai 지원되는 기초 모델
IBM watsonx.ai.You 에서 타사 및 IBM 파운데이션 모델을 사용할 수 있으며, IBM 에서 제공하고 즉시 사용할 수 있는 파운데이션 모델을 사용하거나 조직 전용으로 사용할 수 있도록 온디맨드 파운데이션 모델을 배포할 수 있습니다.
모델 선택 방법
지원되는 작업 및 언어 등 모델 선택에 도움이 되는 요소를 검토하려면 모델 선택 및 Foundation 모델 벤치마크를 참조하세요.
모델 가용성은 데이터 센터 위치에 따라 다릅니다. 자세한 내용은 파운데이션 모델의 지역별 가용성을 참조하세요. 온디맨드 배포 모델은 IBM Cloud 에서만 사용할 수 있습니다.
배포 방식별 기초 모델
배포 방법에 따라, 다중 테넌트 하드웨어에서 직접 기초 모델을 사용하거나 조직에서 사용할 전용 하드웨어에 모델을 배포할 수 있습니다. 모델을 배포하는 다양한 방법에 대한 자세한 내용은 기초 모델 배포 방법을 참고하세요.
즉시 사용 가능한 기초 모델 제공
오픈 소스 및 IBM 기반 모델의 콜렉션은 IBM watsonx.ai에 배치됩니다. Prompt Lab 또는 프로그래밍 방식으로 이러한 기초 모델을 표시할 수 있습니다.
기초 모델 추론에 대한 과금에 대한 자세한 내용은 watsonx.ai 에서 기초 모델 추론에 대한 과금 요율을 참조하세요. 다양한 클라우드 제공업체의 서비스 설명에 대한 자세한 내용은 IBM watsonx.ai 을 참조하세요:
IBM 기초 모델
다음 표에는 IBM 추론을 위해 제공하는 지원되는 IBM 파운데이션 모델이 나와 있습니다.
Hugging Face 과 같은 타사 리포지토리에서 일부 IBM 파운데이션 모델에 액세스할 수도 있습니다. IBM 타사 리포지토리에서 얻은 파운데이션 모델은 IBM 에 의해 면책되지 않습니다. watsonx.ai 에서 액세스하는 IBM 파운데이션 모델만 IBM 에 의해 면책됩니다. IBM 면책과 관련된 계약상 보호에 대한 자세한 내용은 고객 관계 계약( IBM ) 을 참조하세요.
모델 이름 | API 모델 ID | 입력 USD/1,000 ) |
산출 USD/1,000 ) |
컨텍스트 창 (입력 + 출력 토큰) |
기타 정보 |
---|---|---|---|---|---|
granite-3-3-8b-instruct | ibm/granite-3-3-8b-instruct |
$0.0002 | $0.0002 | 131,072 | - 모델 카드 - 웹사이트 |
granite-13b-instruct-v2 | ibm/granite-13b-instruct-v2 |
$0.0006 | $0.0006 | 8,192 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 ' 참고 : 이 기초 모델은 신속하게 조정할 수 있습니다.
|
granite-8b-japanese | ibm/granite-8b-japanese |
$0.0006 | $0.0006 | 4,096 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-3-2b-instruct | ibm/granite-3-2b-instruct |
$0.0001 | $0.0001 | 131,072 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-3-8b-instruct | ibm/granite-3-8b-instruct |
$0.0002 | $0.0002 | 131,072 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-3-2-8b-instruct | ibm/granite-3-2-8b-instruct |
$0.0002 | $0.0002 | 131,072 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-guardian-3-2b | ibm/granite-guardian-3-2b |
$0.0001 | $0.0001 | 131,072 | - 모델 카드 ' - 웹사이트 |
granite-guardian-3-8b | ibm/granite-guardian-3-8b |
$0.0002 | $0.0002 | 131,072 | - 모델 카드 ' - 웹사이트 |
granite-8b-code-instruct | ibm/granite-8b-code-instruct |
$0.0006 | $0.0006 | 128,000 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-vision-3-2-2b | ibm/granite-vision-3-2-2b |
$0.0001 | $0.0001 | 131,072 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
모델 이름 | API 모델 ID | 입력 가격 ( USD/1,000 데이터 포인트) |
출력 가격 ( USD/1,000 데이터 포인트) |
컨텍스트 길이 최소 데이터 포인트 |
기타 정보 |
---|---|---|---|---|---|
granite-ttm-512-96-r2 | ibm/granite-ttm-512-96-r2 |
$0.00013 | $0.00038 | 512 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 ' |
granite-ttm-1024-96-r2 | ibm/granite-ttm-1024-96-r2 |
$0.00013 | $0.00038 | 1,024 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 ' |
granite-ttm-1536-96-r2 | ibm/granite-ttm-1536-96-r2 |
$0.00013 | $0.00038 | 1,536 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 ' |
제3자 재단 모델
다음 표에는 watsonx.ai 함께 제공되는 지원되는 타사 파운데이션 모델이 나와 있습니다.
모델 이름 | API 모델 ID | 제공자 | 입력 USD/1,000 ) |
산출 USD/1,000 ) |
컨텍스트 창 (입력 + 출력 토큰) |
기타 정보 |
---|---|---|---|---|---|---|
allam-1-13b-instruct | sdaia/allam-1-13b-instruct |
국립 인공 지능 센터 (national center for 인공 지능) 와 사우디 아라비아의 데이터 및 인공 지능 기관 (authority for Data and 인공 지능 | $0.0018 | $0.0018 | 4,096 | - 모델 카드 |
elyza-japanese-llama-2-7b-instruct | elyza/elyza-japanese-llama-2-7b-instruct |
ELYZA, 인크. | $0.0018 | $0.0018 | 4,096 | - 모델 카드 ' - note.com 블로그 |
flan-t5-xl-3b | google/flan-t5-xl |
$0.0006 | $0.0006 | 4,096 | - 모델 카드 ' - 연구 논문 ' 참고 : 이 기초 모델은 신속하게 조정할 수 있습니다.
|
|
flan-t5-xxl-11b | google/flan-t5-xxl |
$0.0018 | $0.0018 | 4,096 | - 모델 카드 ' - 연구 논문 |
|
flan-ul2-20b | google/flan-ul2 |
$0.0050 | $0.0050 | 4,096 | - 모델 카드 ' - UL2 연구 논문 ' - 플랜 연구 논문 |
|
jais-13b-chat | core42/jais-13b-chat |
도입/인식 (Inception), Mohamed bin Zayed University of AI (MBZUAI) 및 Cerebras Systems | $0.0018 | $0.0018 | 2,048 | - 모델 카드 ' - 연구 논문 |
llama-4-maverick-17b-128e-instruct-fp8 | meta-llama/llama-4-maverick-17b-128e-instruct-fp |
Meta | $0.00035 | $0.0014 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 |
llama-4-scout-17b-16e-instruct |
meta-llama/llama-4-scout-17b-16e-instruct |
Meta | 미리 보기 중 비용 없음 | 미리 보기 중 비용 없음 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 |
llama-3-3-70b-instruct | meta-llama/llama-3-3-70b-instruct |
Meta | $0.00071 | $0.00071 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 |
llama-3-2-1b-instruct | meta-llama/llama-3-2-1b-instruct |
Meta | $0.0001 | $0.0001 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-3-2-3b-instruct | meta-llama/llama-3-2-3b-instruct |
Meta | $0.00015 | $0.00015 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-3-2-11b-vision-instruct | meta-llama/llama-3-2-11b-vision-instruct |
Meta | $0.00035 | $0.00035 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-3-2-90b-vision-instruct | meta-llama/llama-3-2-90b-vision-instruct |
Meta | $0.0020 | $0.0020 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-guard-3-11b-vision | meta-llama/llama-guard-3-11b-vision |
Meta | $0.00035 | $0.00035 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-3-405b-instruct | meta-llama/llama-3-405b-instruct |
Meta | $0.0050 | $0.016 | 16 ,384 | - 모델 카드 ' - ' Meta AI 블로그 |
llama-2-13b-chat | meta-llama/llama-2-13b-chat |
Meta | $0.0006 | $0.0006 | 4,096 | - 모델 카드 ' - 연구 논문 |
mistral-large | mistralai/mistral-large |
Mistral AI | $0.003 | $0.01 | 131,072 | - 모델 카드 ' - Mistral Large 2 블로그 게시물 |
mistral-medium-2505 | mistralai/mistral-medium-2505 |
Mistral AI | $0.003 | $0.010 | 131,072 | - 모델 카드 - 미스트랄 미디엄 3 블로그 게시물 |
mistral-small-3-1-24b-instruct-2503 | mistralai/mistral-small-3-1-24b-instruct-2503 |
Mistral AI | $0.0001 | $0.0003 | 131,072 | • 모델 카드 • Mistral 3.1 에 대한 블로그 게시물 |
mistral-small-24b-instruct-2501 | mistralai/mistral-small-24b-instruct-2501 |
Mistral AI | $0.00035 | $0.00035 | 32,768 | • 모델 카드 • 미스트랄 스몰 3용 블로그 포스트 |
mixtral-8x7b-instruct-v01 | mistralai/mixtral-8x7b-instruct-v01 |
Mistral AI | $0.0006 | $0.0006 | 32,768 | - 모델 카드 ' - 연구 논문 |
mt0-xxl-13b | bigscience/mt0-xxl |
BigScience | $0.0018 | $0.0018 | 4,096 | - 모델 카드 ' - 연구 논문 |
pixtral-12b | mistralai/pixtral-12b |
Mistral AI | $0.00035 | $0.00035 | 128,000 | - 모델 카드 ' - Pixtral 12B 블로그 게시물 |
온디맨드 기반 모델 배포
IBM 가 큐레이팅한 모델 세트에서 기본 모델을 선택하여 조직 전용으로 배포할 수 있습니다.
IBM 필요에 따라 배포하는 기초 모델
다음 표에는 필요에 따라 배포할 수 있는 IBM 의 기초 모델이 나열되어 있습니다.
일부 IBM 파운데이션 모델은 Hugging Face 과 같은 타사 리포지토리에서도 사용할 수 있습니다. IBM 타사 리포지토리에서 얻은 파운데이션 모델은 IBM 에 의해 면책되지 않습니다. watsonx.ai 에서 액세스하는 IBM 파운데이션 모델만 IBM 에 의해 면책됩니다. IBM 면책과 관련된 계약상 보호에 대한 자세한 내용은 고객 관계 계약( IBM ) 을 참조하세요.
모델 이름 | 시간당 가격(USD) | 모델 호스팅 카테고리 | 컨텍스트 창 (입력 + 출력 토큰) |
---|---|---|---|
granite-3-3-8b-instruct | $5.22 | 소형 | 131,072 |
granite-3-3-2b-instruct | $5.22 | 소형 | 131,072 |
granite-3-2-8b-instruct | $5.22 | 소형 | 131,072 |
granite-3-1-8b-base | $5.22 | 소형 | 131,072 |
granite-8b-japanese | $5.22 | 소형 | 4,096 |
granite-20b-multilingual | $5.22 | 소형 | 8,192 |
granite-13b-chat-v2 | $5.22 | 소형 | 8,192 |
granite-13b-instruct-v2 | $5.22 | 소형 | 8,192 |
granite-3b-code-instruct | $5.22 | 소형 | 128,000 |
granite-8b-code-instruct | $5.22 | 소형 | 128,000 |
granite-20b-code-instruct | $5.22 | 소형 | 8,192 |
granite-34b-code-instruct | $5.22 | 소형 | 8,192 |
granite-20b-code-base-schema-linking | $5.22 | 소형 | 8,192 |
granite-20b-code-base-sql-gen | $5.22 | 소형 | 8,192 |
granite-3-8b-base | $5.22 | 소형 | 4,096 |
온디맨드 기반의 타사 배포 모델
다음 표에는 필요에 따라 배포할 수 있는 타사 재단 모델이 나열되어 있습니다.
모델 이름 | 제공자 | 시간당 가격(USD) | 모델 호스팅 카테고리 | 컨텍스트 창 (입력 + 출력 토큰) |
---|---|---|---|---|
allam-1-13b-instruct | 국립 인공 지능 센터 (national center for 인공 지능) 와 사우디 아라비아의 데이터 및 인공 지능 기관 (authority for Data and 인공 지능 | $5.22 | 소형 | 4,096 |
codellama-34b-instruct-hf | Code Llama | $10.40 | 중간 | 16 ,384 |
deepseek-r1-distill-llama-8b | DeepSeek 인공지능 | $5.22 | 소형 | 131,072 |
deepseek-r1-distill-llama-70b | DeepSeek 인공지능 | $20.85 | 대형 | 131,072 |
eurollm-1-7b-instruct | 전체 프로젝트 | $5.22 | 소형 | 4,096 |
eurollm-9b-instruct | 전체 프로젝트 | $5.22 | 소형 | 4,096 |
flan-t5-xl-3b | $5.22 | 소형 | 4,096 | |
flan-t5-xxl-11b | $5.22 | 소형 | 4,096 | |
flan-ul2-20b | $5.22 | 소형 | 4,096 | |
llama-2-13b-chat | Meta | $5.22 | 소형 | 4,096 |
llama-2-70b-chat | Meta | $20.85 | 대형 | 4,096 |
llama-3-8b-instruct | Meta | $5.22 | 소형 | 8,192 |
llama-3-70b-instruct | Meta | $20.85 | 대형 | 8,192 |
llama-3-1-8b | Meta | $5.22 | 소형 | 131,072 |
llama-3-1-70b | Meta | $20.85 | 대형 | 131,072 |
llama-3-1-8b-instruct | Meta | $5.22 | 소형 | 131,072 |
llama-3-1-70b-instruct | Meta | $20.85 | 대형 | 131,072 |
llama-3-2-11b-vision-instruct | Meta | $5.22 | 소형 | 131,072 |
llama-3-3-70b-instruct | Meta | $10.40 | 중간 | 131,072 |
llama-3-3-70b-instruct-hf | Meta | $20.85 | 대형 | 131,072 |
mixtral-8x7b-base | Mistral AI | $10.40 | 중간 | 32,768 |
mixtral-8x7b-instruct-v01 | Mistral AI | $10.40 | 중간 | 32,768 |
mistral-large-instruct-2407 | Mistral AI | 55.15 (참고 참조) | 대형 | 131,072 |
mistral-large-instruct-2411 | Mistral AI | 55.15 (참고 참조) | 대형 | 131,072 |
mistral-nemo-instruct-2407 | Mistral AI | $5.22 | 소형 | 131,072 |
mt0-xxl-13b | BigScience | $5.22 | 소형 | 4,096 |
poro-34b-chat | LumiOpen | $10.40 | 중간 | 2,048 |
Mistral AI 에서 mistral-large-instruct-2411 및 mistral-large-instruct-2407 재단 모델을 전용으로 사용하기 위해서는 시간당 액세스 요금이 부과됩니다. 이러한 온디맨드 기반 모델의 호스팅에 대한 총 가격은 액세스 가격과 호스팅 가격의 합계입니다.
호스팅: $ 20.85 + 액세스: $ 34.30 = 총액: $ 55.15 시간당 미화 달러
자세히 알아보기
- IBM 기초 모델
- 제3자 재단 모델
- IBM 가 텍스트 임베딩과 순위 재지정을 위해 제공하는 기초 모델에 대한 자세한 정보는 지원되는 인코더 모델을 참고하세요.
- 각 지역 데이터 센터에서 제공되는 모델 목록은 재단 모델의 지역별 가용성을 참조하십시오.
- 기초 모델 가격 책정에 대한 자세한 내용은 생성형 AI 자산의 청구 세부 정보를 참조하십시오.
- 가격 및 속도 제한에 대한 자세한 내용은 watsonx.ai 런타임 요금제를 참조하세요.
상위 주제: 인공지능 솔루션