최신 변환이 아님
watsonx.ai 지원되는 기초 모델
IBM watsonx.ai 에서 타사 모델과 IBM Foundation 모델을 사용할 수 있습니다. IBM 에서 제공하는 기초 모델을 즉시 사용할 수 있도록 제공하거나, 조직 전용으로 사용하기 위해 필요할 때 기초 모델을 배포할 수 있습니다.
모델 선택 방법Copy link to section
지원되는 작업 및 언어 등 모델 선택에 도움이 되는 요소를 검토하려면 모델 선택 및 Foundation 모델 벤치마크를 참조하세요.
배포 방식별 기초 모델Copy link to section
배포 방법에 따라, 다중 테넌트 하드웨어에서 직접 기초 모델을 사용하거나 조직에서 사용할 전용 하드웨어에 모델을 배포할 수 있습니다. 모델을 배포하는 다양한 방법에 대한 자세한 내용은 기초 모델 배포 방법을 참고하세요.
즉시 사용 가능한 기초 모델 제공Copy link to section
오픈 소스 및 IBM 기반 모델의 콜렉션은 IBM watsonx.ai에 배치됩니다. Prompt Lab 또는 프로그래밍 방식으로 이러한 기초 모델을 표시할 수 있습니다.
IBM 기초 모델Copy link to section
다음 표에는 IBM 추론을 위해 제공하는 지원되는 IBM 파운데이션 모델이 나와 있습니다.
사용량은 자원 단위(RU)로 측정됩니다. 각 단위는 기초 모델 추론의 입력과 출력에서 1,000 토큰 과 같습니다. 모델 가격이 계산되고 모니터링되는 방법에 대한 자세한 내용은 생성형 AI 자산에 대한 청구 세부 정보를 참조하세요.
또한 Hugging Face 와 같은 제3자 저장소에서 일부 IBM 기초 모델에 액세스할 수 있습니다. 타사 리포지토리에서 얻은 IBM 파운데이션 모델은 IBM 면책되지 않습니다. watsonx.ai 액세스하는 IBM 파운데이션 모델에 대해서만 IBM 면책합니다. IBM 면책과 관련된 계약상 보호에 대한 자세한 내용은 IBM 고객 관계 계약 및 IBM watsonx.ai 서비스 설명을 참조하세요.
모델 이름 | API 모델 ID | 입력 USD/1,000 ) |
산출 USD/1,000 ) |
컨텍스트 창 (입력 + 출력 토큰) |
기타 정보 |
---|---|---|---|---|---|
granite-13b-instruct-v2 |
|
$0.0006 | $0.0006 | 8,192 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 ' 참고 : 이 기초 모델은 신속하게 조정할 수 있습니다.
|
granite-8b-japanese |
|
$0.0006 | $0.0006 | 4,096 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-20b-multilingual |
|
$0.0006 | $0.0006 | 8,192 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-3-2b-instruct |
|
$0.0001 | $0.0001 | 131,072 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-3-8b-instruct |
|
$0.0002 | $0.0002 | 131,072 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-3-2-8b-instruct |
|
$0.0002 | $0.0002 | 131,072 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-guardian-3-2b |
|
$0.0001 | $0.0001 | 131,072 | - 모델 카드 ' - 웹사이트 |
granite-guardian-3-8b |
|
$0.0002 | $0.0002 | 131,072 | - 모델 카드 ' - 웹사이트 |
granite-3b-code-instruct |
|
$0.0006 | $0.0006 | 128,000 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-8b-code-instruct |
|
$0.0006 | $0.0006 | 128,000 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-20b-code-instruct |
|
$0.0006 | $0.0006 | 8,192 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-34b-code-instruct |
|
$0.0006 | $0.0006 | 8,192 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
granite-vision-3-2-2b |
|
$0.0001 | $0.0001 | 131,072 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 |
모델 이름 | API 모델 ID | 입력 가격 ( USD/1,000 데이터 포인트) |
출력 가격 ( USD/1,000 데이터 포인트) |
컨텍스트 길이 최소 데이터 포인트 |
기타 정보 |
---|---|---|---|---|---|
granite-ttm-512-96-r2 |
|
$0.00013 | $0.00038 | 512 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 ' |
granite-ttm-1024-96-r2 |
|
$0.00013 | $0.00038 | 1,024 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 ' |
granite-ttm-1536-96-r2 |
|
$0.00013 | $0.00038 | 1,536 | - 모델 카드 ' - 웹사이트 ' - 연구 논문 ' |
제3자 재단 모델Copy link to section
다음 표에는 watsonx.ai 함께 제공되는 지원되는 타사 파운데이션 모델이 나와 있습니다.
사용량은 자원 단위(RU)로 측정됩니다. 각 단위는 기초 모델 추론의 입력과 출력에서 1,000 토큰 과 같습니다. 모델 가격이 계산되고 모니터링되는 방법에 대한 자세한 내용은 생성형 AI 자산에 대한 청구 세부 정보를 참조하세요.
모델 이름 | API 모델 ID | 제공자 | 입력 USD/1,000 ) |
산출 USD/1,000 ) |
컨텍스트 창 (입력 + 출력 토큰) |
기타 정보 |
---|---|---|---|---|---|---|
allam-1-13b-instruct |
|
국립 인공 지능 센터 (national center for 인공 지능) 와 사우디 아라비아의 데이터 및 인공 지능 기관 (authority for Data and 인공 지능 | $0.0018 | $0.0018 | 4,096 | - 모델 카드 |
elyza-japanese-llama-2-7b-instruct |
|
ELYZA, 인크. | $0.0018 | $0.0018 | 4,096 | - 모델 카드 ' - note.com 블로그 |
flan-t5-xl-3b |
|
$0.0006 | $0.0006 | 4,096 | - 모델 카드 ' - 연구 논문 ' 참고 : 이 기초 모델은 신속하게 조정할 수 있습니다.
|
|
flan-t5-xxl-11b |
|
$0.0018 | $0.0018 | 4,096 | - 모델 카드 ' - 연구 논문 |
|
flan-ul2-20b |
|
$0.0050 | $0.0050 | 4,096 | - 모델 카드 ' - UL2 연구 논문 ' - 플랜 연구 논문 |
|
jais-13b-chat |
|
도입/인식 (Inception), Mohamed bin Zayed University of AI (MBZUAI) 및 Cerebras Systems | $0.0018 | $0.0018 | 2,048 | - 모델 카드 ' - 연구 논문 |
llama-3-3-70b-instruct |
|
Meta | $0.00071 | $0.00071 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 |
llama-3-2-1b-instruct |
|
Meta | $0.0001 | $0.0001 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-3-2-3b-instruct |
|
Meta | $0.00015 | $0.00015 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-3-2-11b-vision-instruct |
|
Meta | $0.00035 | $0.00035 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-3-2-90b-vision-instruct |
|
Meta | $0.0020 | $0.0020 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-guard-3-11b-vision |
|
Meta | $0.00035 | $0.00035 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 ' - 연구 논문 |
llama-3-1-8b-instruct |
|
Meta | $0.0006 | $0.0006 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 |
llama-3-1-70b-instruct |
|
Meta | $0.0018 | $0.0018 | 131,072 | - 모델 카드 ' - ' Meta AI 블로그 |
llama-3-405b-instruct |
|
Meta | $0.0050 | $0.016 | 16 ,384 | - 모델 카드 ' - ' Meta AI 블로그 |
llama-2-13b-chat |
|
Meta | $0.0006 | $0.0006 | 4,096 | - 모델 카드 ' - 연구 논문 |
mistral-large |
|
Mistral AI | $0.003 | $0.01 | 131,072 | - 모델 카드 ' - Mistral Large 2 블로그 게시물 |
mistral-small-24b-instruct-2501 |
|
Mistral AI | $0.00035 | $0.00035 | 32,768 | • 모델 카드 • 미스트랄 스몰 3용 블로그 포스트 |
mixtral-8x7b-instruct-v01 |
|
Mistral AI | $0.0006 | $0.0006 | 32,768 | - 모델 카드 ' - 연구 논문 |
mt0-xxl-13b |
|
BigScience | $0.0018 | $0.0018 | 4,096 | - 모델 카드 ' - 연구 논문 |
pixtral-12b |
|
Mistral AI | $0.00035 | $0.00035 | 128,000 | - 모델 카드 ' - Pixtral 12B 블로그 게시물 |
온디맨드 기반 모델 배포Copy link to section
IBM 가 큐레이팅한 모델 세트에서 기본 모델을 선택하여 조직 전용으로 배포할 수 있습니다.
IBM 필요에 따라 배포하는 기초 모델Copy link to section
다음 표에는 필요에 따라 배포할 수 있는 IBM 의 기초 모델이 나열되어 있습니다.
IBM 의 일부 기초 모델은 Hugging Face 와 같은 제3자 저장소에서도 이용 가능합니다. 타사 리포지토리에서 얻은 IBM 파운데이션 모델은 IBM 면책되지 않습니다. watsonx.ai 액세스하는 IBM 파운데이션 모델에 대해서만 IBM 면책합니다. IBM 면책과 관련된 계약상 보호에 대한 자세한 내용은 IBM 고객 관계 계약 및 IBM watsonx.ai 서비스 설명을 참조하세요.
모델 이름 | 시간당 가격(USD) | 모델 호스팅 카테고리 | 컨텍스트 창 (입력 + 출력 토큰) |
---|---|---|---|
granite-7b-lab | $5.22 | 소형 | 4,096 |
granite-8b-japanese | $5.22 | 소형 | 4,096 |
granite-20b-multilingual | $5.22 | 소형 | 8,192 |
granite-13b-chat-v2 | $5.22 | 소형 | 8,192 |
granite-13b-instruct-v2 | $5.22 | 소형 | 8,192 |
granite-3b-code-instruct | $5.22 | 소형 | 128,000 |
granite-8b-code-instruct | $5.22 | 소형 | 128,000 |
granite-20b-code-instruct | $5.22 | 소형 | 8,192 |
granite-34b-code-instruct | $5.22 | 소형 | 8,192 |
granite-20b-code-base-schema-linking | $5.22 | 소형 | 8,192 |
granite-20b-code-base-sql-gen | $5.22 | 소형 | 8,192 |
granite-3-8b-base | $5.22 | 소형 | 4,096 |
온디맨드 기반의 타사 배포 모델Copy link to section
다음 표에는 필요에 따라 배포할 수 있는 타사 재단 모델이 나열되어 있습니다.
모델 이름 | 제공자 | 시간당 가격(USD) | 모델 호스팅 카테고리 | 컨텍스트 창 (입력 + 출력 토큰) |
---|---|---|---|---|
allam-1-13b-instruct | 국립 인공 지능 센터 (national center for 인공 지능) 와 사우디 아라비아의 데이터 및 인공 지능 기관 (authority for Data and 인공 지능 | $5.22 | 소형 | 4,096 |
deepseek-r1-distill-llama-8b | DeepSeek 인공지능 | $5.22 | 소형 | 131,072 |
deepseek-r1-distill-llama-70b | DeepSeek 인공지능 | $20.85 | 대형 | 131,072 |
eurollm-1-7b-instruct | 전체 프로젝트 | $5.22 | 소형 | 4,096 |
eurollm-9b-instruct | 전체 프로젝트 | $5.22 | 소형 | 4,096 |
flan-t5-xl-3b | $5.22 | 소형 | 4,096 | |
flan-t5-xxl-11b | $5.22 | 소형 | 4,096 | |
flan-ul2-20b | $5.22 | 소형 | 4,096 | |
llama-2-13b-chat | Meta | $5.22 | 소형 | 4,096 |
llama-2-70b-chat | Meta | $20.85 | 대형 | 4,096 |
llama-3-8b-instruct | Meta | $5.22 | 소형 | 8,192 |
llama-3-70b-instruct | Meta | $20.85 | 대형 | 8,192 |
llama-3-1-8b | Meta | $5.22 | 소형 | 131,072 |
llama-3-1-8b-instruct | Meta | $5.22 | 소형 | 131,072 |
llama-3-1-70b-instruct | Meta | $20.85 | 대형 | 131,072 |
llama-3-3-70b-instruct | Meta | $10.40 | 중간 | 131,072 |
llama-3-3-70b-instruct-hf | Meta | $20.85 | 대형 | 131,072 |
mixtral-8x7b-base | Mistral AI | $10.40 | 중간 | 32,768 |
mixtral-8x7b-instruct-v01 | Mistral AI | $10.40 | 중간 | 32,768 |
mistral-large-instruct-2407 | Mistral AI | 55.15 (참고 참조) | 대형 | 131,072 |
mistral-large-instruct-2411 | Mistral AI | 55.15 (참고 참조) | 대형 | 131,072 |
mistral-nemo-instruct-2407 | Mistral AI | $5.22 | 소형 | 131,072 |
mt0-xxl-13b | BigScience | $5.22 | 소형 | 4,096 |
호스팅: $ 20.85 + 액세스: $ 34.30 = 총액: $ 55.15 시간당 미화 달러
자세히 알아보기Copy link to section
- IBM 기초 모델
- 제3자 재단 모델
- IBM 가 텍스트 임베딩과 순위 재지정을 위해 제공하는 기초 모델에 대한 자세한 정보는 지원되는 인코더 모델을 참고하세요.
- 각 지역 데이터 센터에서 제공되는 모델 목록은 재단 모델의 지역별 가용성을 참조하십시오.
- 기초 모델 가격 책정에 대한 자세한 내용은 생성형 AI 자산의 청구 세부 정보를 참조하십시오.
- 가격 및 속도 제한에 대한 자세한 내용은 watsonx.ai 런타임 요금제를 참조하세요.
상위 주제: 인공지능 솔루션