0 / 0

watsonx.ai 지원되는 기초 모델

마지막 업데이트 날짜: 2025년 7월 17일
watsonx.ai 지원되는 기초 모델

IBM watsonx.ai.You 에서 타사 및 IBM 파운데이션 모델을 사용할 수 있으며, IBM 에서 제공하고 즉시 사용할 수 있는 파운데이션 모델을 사용하거나 조직 전용으로 사용할 수 있도록 온디맨드 파운데이션 모델을 배포할 수 있습니다.

모델 선택 방법

지원되는 작업 및 언어 등 모델 선택에 도움이 되는 요소를 검토하려면 모델 선택Foundation 모델 벤치마크를 참조하세요.

주의:

모델 가용성은 데이터 센터 위치에 따라 다릅니다. 자세한 내용은 파운데이션 모델의 지역별 가용성을 참조하세요. 온디맨드 배포 모델은 IBM Cloud 에서만 사용할 수 있습니다.

배포 방식별 기초 모델

배포 방법에 따라, 다중 테넌트 하드웨어에서 직접 기초 모델을 사용하거나 조직에서 사용할 전용 하드웨어에 모델을 배포할 수 있습니다. 모델을 배포하는 다양한 방법에 대한 자세한 내용은 기초 모델 배포 방법을 참고하세요.

테이블 1. 배포 방식별 기초 모델
제공자 watsonx.ai 함께 제공
(토큰당 지불)
온디맨드 배포
(시간 단위로 지불)
IBM - granite-3-3-8b-instruct
- granite-13b-instruct-v2 (사용 중단됨)
- - - granite-8b-japanese (사용 중단됨)
- granite-3-8b-base
- granite-3-2b-instruct
- granite-3-8b-instruct
- granite-3-2-8b-instruct
- granite-guardian-3-2b (사용 중단됨)
- - - - granite-guardian-3-8b
- granite-8b-code-instruct
- granite-vision-3-2-2b
- granite-3-3-8b-instruct
- granite-3-1-8b-base
- granite-3-3-2b-instruct
- granite-3-2-8b-instruct
- granite-7b-lab
- granite-8b-japanese
- granite-13b-chat-v2
- granite-13b-instruct-v2 (사용 중단됨)
- - granite-20b-multilingual
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
- granite-20b-code-base-schema-linking
- granite-20b-code-base-sql-gen
Google - flan-t5-xl-3b (사용 중단됨)
- (사용 중단됨) flan-t5-xxl-11b (사용 중단됨)
- (사용 중단됨) flan-ul2-20b (사용 중단됨)
- flan-t5-xl-3b (사용 중단됨)
- (사용 중단됨) flan-t5-xxl-11b (사용 중단됨)
- (사용 중단됨) flan-ul2-20b (사용 중단됨)
Meta - llama-4-maverick-17b-128e-instruct-fp8
- llama-4-scout-17b-16e-instruct (사용 중단됨) 베타
- - llama-3-3-70b-instruct
- llama-3-2-1b-instruct
- llama-3-2-3b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct
- llama-guard-3-11b-vision-instruct
- llama-2-13b-chat (사용 중단됨)

- llama-3-1-70b
- llama-3-2-11b-vision-instruct
- llama-3-3-70b-instruct
- llama-3-3-70b-instruct-hf
- LLAMA-3-1-70B-인스트럭트
- - - - llama-2-13b-chat
- llama-2-70b-chat
- llama-3-8b-instruct
- llama-3-70b-instruct
- llama-3-1-8b
- llama-3-1-8b-instruct
Mistral AI - mistral-small-3-1-24b-instruct-2503
- mistral-large (사용 중단됨)
- - mistral-medium-2505
- mistral-small-24b-instruct-2501 (사용 중단됨)
- - mixtral-8x7b-instruct-v01 (사용 중단됨)
- - (사용 중단됨) pixtral-12b (사용 중단됨)
mistral-large-instruct-2407
mistral-large-instruct-2411
mistral-nemo-instruct-2407
mixtral-8x7b-base
mixtral-8x7b-instruct-v01
BigScience mt0-xxl-13b
Code Llama codellama-34b-instruct-hf
DeepSeek 인공지능 deepseek-r1-distill-llama-8b
deepseek-r1-distill-llama-70b
ELYZA, 인크. - elyza-japanese-llama-2-7b-instruct (사용 중단됨)
Inception jais-13b-chat
SDAIA allam-1-13b-instruct allam-1-13b-instruct
확장 현실을 위한 통합 전사 및 번역(UTTER) 프로젝트 - EUROLM-1-7B-INTRUCT
- eurollm-9b-instruct
LumiOpen poro-34b-chat

즉시 사용 가능한 기초 모델 제공

오픈 소스 및 IBM 기반 모델의 콜렉션은 IBM watsonx.ai에 배치됩니다. Prompt Lab 또는 프로그래밍 방식으로 이러한 기초 모델을 표시할 수 있습니다.

기초 모델 추론에 대한 과금에 대한 자세한 내용은 watsonx.ai 에서 기초 모델 추론에 대한 과금 요율을 참조하세요. 다양한 클라우드 제공업체의 서비스 설명에 대한 자세한 내용은 IBM watsonx.ai 을 참조하세요:

IBM 기초 모델

다음 표에는 IBM 추론을 위해 제공하는 지원되는 IBM 파운데이션 모델이 나와 있습니다.

Hugging Face 과 같은 타사 리포지토리에서 일부 IBM 파운데이션 모델에 액세스할 수도 있습니다. IBM 타사 리포지토리에서 얻은 파운데이션 모델은 IBM 에 의해 면책되지 않습니다. watsonx.ai 에서 액세스하는 IBM 파운데이션 모델만 IBM 에 의해 면책됩니다. IBM 면책과 관련된 계약상 보호에 대한 자세한 내용은 고객 관계 계약( IBM ) 을 참조하세요.

표 2a. IBM watsonx.ai 에서 제공하는 추론용 기초 모델
모델 이름 API 모델 ID 입력
USD/1,000 )
산출
USD/1,000 )
컨텍스트 창
(입력 + 출력 토큰)
기타 정보
granite-3-3-8b-instruct ibm/granite-3-3-8b-instruct $0.0002 $0.0002 131,072 - 모델 카드
- 웹사이트
granite-13b-instruct-v2 ibm/granite-13b-instruct-v2 $0.0006 $0.0006 8,192 - 모델 카드
' - 웹사이트
' - 연구 논문
'
참고 : 이 기초 모델은 신속하게 조정할 수 있습니다.
granite-8b-japanese ibm/granite-8b-japanese $0.0006 $0.0006 4,096 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-3-2b-instruct ibm/granite-3-2b-instruct $0.0001 $0.0001 131,072 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-3-8b-instruct ibm/granite-3-8b-instruct $0.0002 $0.0002 131,072 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-3-2-8b-instruct ibm/granite-3-2-8b-instruct $0.0002 $0.0002 131,072 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-guardian-3-2b ibm/granite-guardian-3-2b $0.0001 $0.0001 131,072 - 모델 카드
' - 웹사이트
granite-guardian-3-8b ibm/granite-guardian-3-8b $0.0002 $0.0002 131,072 - 모델 카드
' - 웹사이트
granite-8b-code-instruct ibm/granite-8b-code-instruct $0.0006 $0.0006 128,000 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-vision-3-2-2b ibm/granite-vision-3-2-2b $0.0001 $0.0001 131,072 - 모델 카드
' - 웹사이트
' - 연구 논문

 

표 2b. IBM watsonx.ai 에서 제공하는 기초 모델로 미래 가치 예측
모델 이름 API 모델 ID 입력 가격
( USD/1,000 데이터 포인트)
출력 가격
( USD/1,000 데이터 포인트)
컨텍스트 길이
최소 데이터 포인트
기타 정보
granite-ttm-512-96-r2 ibm/granite-ttm-512-96-r2 $0.00013 $0.00038 512 - 모델 카드
' - 웹사이트
' - 연구 논문
'
granite-ttm-1024-96-r2 ibm/granite-ttm-1024-96-r2 $0.00013 $0.00038 1,024 - 모델 카드
' - 웹사이트
' - 연구 논문
'
granite-ttm-1536-96-r2 ibm/granite-ttm-1536-96-r2 $0.00013 $0.00038 1,536 - 모델 카드
' - 웹사이트
' - 연구 논문
'

 

제3자 재단 모델

다음 표에는 watsonx.ai 함께 제공되는 지원되는 타사 파운데이션 모델이 나와 있습니다.

테이블 3. 와 함께 제공되는 타사 파운데이션 모델( watsonx.ai )
모델 이름 API 모델 ID 제공자 입력
USD/1,000 )
산출
USD/1,000 )
컨텍스트 창
(입력 + 출력 토큰)
기타 정보
allam-1-13b-instruct sdaia/allam-1-13b-instruct 국립 인공 지능 센터 (national center for 인공 지능) 와 사우디 아라비아의 데이터 및 인공 지능 기관 (authority for Data and 인공 지능 $0.0018 $0.0018 4,096 - 모델 카드
elyza-japanese-llama-2-7b-instruct elyza/elyza-japanese-llama-2-7b-instruct ELYZA, 인크. $0.0018 $0.0018 4,096 - 모델 카드
' - note.com 블로그
flan-t5-xl-3b google/flan-t5-xl Google $0.0006 $0.0006 4,096 - 모델 카드
' - 연구 논문
'
참고 : 이 기초 모델은 신속하게 조정할 수 있습니다.
flan-t5-xxl-11b google/flan-t5-xxl Google $0.0018 $0.0018 4,096 - 모델 카드
' - 연구 논문
flan-ul2-20b google/flan-ul2 Google $0.0050 $0.0050 4,096 - 모델 카드
' - UL2 연구 논문
' - 플랜 연구 논문
jais-13b-chat core42/jais-13b-chat 도입/인식 (Inception), Mohamed bin Zayed University of AI (MBZUAI) 및 Cerebras Systems $0.0018 $0.0018 2,048 - 모델 카드
' - 연구 논문
llama-4-maverick-17b-128e-instruct-fp8 meta-llama/llama-4-maverick-17b-128e-instruct-fp Meta $0.00035 $0.0014 131,072 - 모델 카드
' - ' Meta AI 블로그
llama-4-scout-17b-16e-instruct 베타 meta-llama/llama-4-scout-17b-16e-instruct Meta 미리 보기 중 비용 없음 미리 보기 중 비용 없음 131,072 - 모델 카드
' - ' Meta AI 블로그
llama-3-3-70b-instruct meta-llama/llama-3-3-70b-instruct Meta $0.00071 $0.00071 131,072 - 모델 카드
' - ' Meta AI 블로그
llama-3-2-1b-instruct meta-llama/llama-3-2-1b-instruct Meta $0.0001 $0.0001 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-3-2-3b-instruct meta-llama/llama-3-2-3b-instruct Meta $0.00015 $0.00015 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-3-2-11b-vision-instruct meta-llama/llama-3-2-11b-vision-instruct Meta $0.00035 $0.00035 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-3-2-90b-vision-instruct meta-llama/llama-3-2-90b-vision-instruct Meta $0.0020 $0.0020 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-guard-3-11b-vision meta-llama/llama-guard-3-11b-vision Meta $0.00035 $0.00035 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-3-405b-instruct meta-llama/llama-3-405b-instruct Meta $0.0050 $0.016 16 ,384 - 모델 카드
' - ' Meta AI 블로그
llama-2-13b-chat meta-llama/llama-2-13b-chat Meta $0.0006 $0.0006 4,096 - 모델 카드
' - 연구 논문
mistral-large mistralai/mistral-large Mistral AI $0.003 $0.01 131,072 - 모델 카드
' - Mistral Large 2 블로그 게시물
mistral-medium-2505 mistralai/mistral-medium-2505 Mistral AI $0.003 $0.010 131,072 - 모델 카드
- 미스트랄 미디엄 3 블로그 게시물
mistral-small-3-1-24b-instruct-2503 mistralai/mistral-small-3-1-24b-instruct-2503 Mistral AI $0.0001 $0.0003 131,072 모델 카드
Mistral 3.1 에 대한 블로그 게시물
mistral-small-24b-instruct-2501 mistralai/mistral-small-24b-instruct-2501 Mistral AI $0.00035 $0.00035 32,768 모델 카드
미스트랄 스몰 3용 블로그 포스트
mixtral-8x7b-instruct-v01 mistralai/mixtral-8x7b-instruct-v01 Mistral AI $0.0006 $0.0006 32,768 - 모델 카드
' - 연구 논문
mt0-xxl-13b bigscience/mt0-xxl BigScience $0.0018 $0.0018 4,096 - 모델 카드
' - 연구 논문
pixtral-12b mistralai/pixtral-12b Mistral AI $0.00035 $0.00035 128,000 - 모델 카드
' - Pixtral 12B 블로그 게시물

온디맨드 기반 모델 배포

IBM 가 큐레이팅한 모델 세트에서 기본 모델을 선택하여 조직 전용으로 배포할 수 있습니다.

IBM 필요에 따라 배포하는 기초 모델

다음 표에는 필요에 따라 배포할 수 있는 IBM 의 기초 모델이 나열되어 있습니다.

일부 IBM 파운데이션 모델은 Hugging Face 과 같은 타사 리포지토리에서도 사용할 수 있습니다. IBM 타사 리포지토리에서 얻은 파운데이션 모델은 IBM 에 의해 면책되지 않습니다. watsonx.ai 에서 액세스하는 IBM 파운데이션 모델만 IBM 에 의해 면책됩니다. IBM 면책과 관련된 계약상 보호에 대한 자세한 내용은 고객 관계 계약( IBM ) 을 참조하세요.

표 4. IBM 에서 온디맨드 배포가 가능한 파운데이션 모델 watsonx.ai
모델 이름 시간당 가격(USD) 모델 호스팅 카테고리 컨텍스트 창
(입력 + 출력 토큰)
granite-3-3-8b-instruct $5.22 소형 131,072
granite-3-3-2b-instruct $5.22 소형 131,072
granite-3-2-8b-instruct $5.22 소형 131,072
granite-3-1-8b-base $5.22 소형 131,072
granite-8b-japanese $5.22 소형 4,096
granite-20b-multilingual $5.22 소형 8,192
granite-13b-chat-v2 $5.22 소형 8,192
granite-13b-instruct-v2 $5.22 소형 8,192
granite-3b-code-instruct $5.22 소형 128,000
granite-8b-code-instruct $5.22 소형 128,000
granite-20b-code-instruct $5.22 소형 8,192
granite-34b-code-instruct $5.22 소형 8,192
granite-20b-code-base-schema-linking $5.22 소형 8,192
granite-20b-code-base-sql-gen $5.22 소형 8,192
granite-3-8b-base $5.22 소형 4,096

 

온디맨드 기반의 타사 배포 모델

다음 표에는 필요에 따라 배포할 수 있는 타사 재단 모델이 나열되어 있습니다.

표 5. 다음에서 온디맨드로 배포할 수 있는 타사 파운데이션 모델 watsonx.ai
모델 이름 제공자 시간당 가격(USD) 모델 호스팅 카테고리 컨텍스트 창
(입력 + 출력 토큰)
allam-1-13b-instruct 국립 인공 지능 센터 (national center for 인공 지능) 와 사우디 아라비아의 데이터 및 인공 지능 기관 (authority for Data and 인공 지능 $5.22 소형 4,096
codellama-34b-instruct-hf Code Llama $10.40 중간 16 ,384
deepseek-r1-distill-llama-8b DeepSeek 인공지능 $5.22 소형 131,072
deepseek-r1-distill-llama-70b DeepSeek 인공지능 $20.85 대형 131,072
eurollm-1-7b-instruct 전체 프로젝트 $5.22 소형 4,096
eurollm-9b-instruct 전체 프로젝트 $5.22 소형 4,096
flan-t5-xl-3b Google $5.22 소형 4,096
flan-t5-xxl-11b Google $5.22 소형 4,096
flan-ul2-20b Google $5.22 소형 4,096
llama-2-13b-chat Meta $5.22 소형 4,096
llama-2-70b-chat Meta $20.85 대형 4,096
llama-3-8b-instruct Meta $5.22 소형 8,192
llama-3-70b-instruct Meta $20.85 대형 8,192
llama-3-1-8b Meta $5.22 소형 131,072
llama-3-1-70b Meta $20.85 대형 131,072
llama-3-1-8b-instruct Meta $5.22 소형 131,072
llama-3-1-70b-instruct Meta $20.85 대형 131,072
llama-3-2-11b-vision-instruct Meta $5.22 소형 131,072
llama-3-3-70b-instruct Meta $10.40 중간 131,072
llama-3-3-70b-instruct-hf Meta $20.85 대형 131,072
mixtral-8x7b-base Mistral AI $10.40 중간 32,768
mixtral-8x7b-instruct-v01 Mistral AI $10.40 중간 32,768
mistral-large-instruct-2407 Mistral AI 55.15 (참고 참조) 대형 131,072
mistral-large-instruct-2411 Mistral AI 55.15 (참고 참조) 대형 131,072
mistral-nemo-instruct-2407 Mistral AI $5.22 소형 131,072
mt0-xxl-13b BigScience $5.22 소형 4,096
poro-34b-chat LumiOpen $10.40 중간 2,048

 

참고:

Mistral AI 에서 mistral-large-instruct-2411 및 mistral-large-instruct-2407 재단 모델을 전용으로 사용하기 위해서는 시간당 액세스 요금이 부과됩니다. 이러한 온디맨드 기반 모델의 호스팅에 대한 총 가격은 액세스 가격과 호스팅 가격의 합계입니다.

호스팅: $ 20.85 + 액세스: $ 34.30 = 총액: $ 55.15 시간당 미화 달러

자세히 알아보기

상위 주제: 인공지능 솔루션