watsonx.ai 지원되는 기초 모델

마지막 업데이트 날짜: 2025년 4월 04일
watsonx.ai 지원되는 기초 모델

IBM watsonx.ai 에서 타사 모델과 IBM Foundation 모델을 사용할 수 있습니다. IBM 에서 제공하는 기초 모델을 즉시 사용할 수 있도록 제공하거나, 조직 전용으로 사용하기 위해 필요할 때 기초 모델을 배포할 수 있습니다.

모델 선택 방법

지원되는 작업 및 언어 등 모델 선택에 도움이 되는 요소를 검토하려면 모델 선택Foundation 모델 벤치마크를 참조하세요.

배포 방식별 기초 모델

배포 방법에 따라, 다중 테넌트 하드웨어에서 직접 기초 모델을 사용하거나 조직에서 사용할 전용 하드웨어에 모델을 배포할 수 있습니다. 모델을 배포하는 다양한 방법에 대한 자세한 내용은 기초 모델 배포 방법을 참고하세요.

테이블 1. 배포 방식별 기초 모델
제공자 watsonx.ai 함께 제공
(토큰당 지불)
온디맨드 배포
(시간 단위로 지불)
IBM - granite-13b-instruct-v2
- granite-8b-japanese (사용 중단)
- - granite-3-8b-base
- granite-20b-multilingual (사용 중단됨)
- - granite-3-2b-instruct
- granite-3-8b-instruct
- granite-3-2-8b-instruct
- granite-guardian-3-2b
- granite-guardian-3-8b
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
- granite-vision-3-2-2b
granite-7b-lab
granite-8b-japanese
granite-13b-chat-v2
granite-13b-instruct-v2
granite-20b-multilingual
granite-3b-code-instruct
granite-8b-code-instruct
granite-20b-code-instruct
granite-34b-code-instruct
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Google flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
Meta - llama-3-3-70b-instruct
- llama-3-2-1b-instruct
- llama-3-2-3b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct
- llama-guard-3-11b-vision-instruct
- llama-3-1-8b-instruct (사용 중단)
- (사용 중단) llama-3-1-70b-instruct (사용 중단됨)
- (사용 중단됨) llama-2-13b-chat (사용 중단됨)
llama-3-3-70b-instruct
llama-3-3-70b-instruct-hf
llama-3-1-70b-instruct
llama-2-13b-chat
llama-2-70b-chat
llama-3-8b-instruct
llama-3-70b-instruct
llama-3-1-8b
llama-3-1-8b-instruct
Mistral AI mistral-large
mistral-small-24b-instruct-2501
mixtral-8x7b-instruct-v01
pixtral-12b
mistral-large-instruct-2407
mistral-large-instruct-2411
mistral-nemo-instruct-2407
mixtral-8x7b-base
mixtral-8x7b-instruct-v01
BigScience mt0-xxl-13b
Code Llama
DeepSeek 인공지능 deepseek-r1-distill-llama-8b
deepseek-r1-distill-llama-70b
ELYZA, 인크. elyza-japanese-llama-2-7b-instruct
Inception jais-13b-chat
SDAIA allam-1-13b-instruct allam-1-13b-instruct
확장 현실을 위한 통합 전사 및 번역(UTTER) 프로젝트 - EUROLM-1-7B-INTRUCT
- eurollm-9b-instruct

즉시 사용 가능한 기초 모델 제공

오픈 소스 및 IBM 기반 모델의 콜렉션은 IBM watsonx.ai에 배치됩니다. Prompt Lab 또는 프로그래밍 방식으로 이러한 기초 모델을 표시할 수 있습니다.

IBM 기초 모델

다음 표에는 IBM 추론을 위해 제공하는 지원되는 IBM 파운데이션 모델이 나와 있습니다.

사용량은 자원 단위(RU)로 측정됩니다. 각 단위는 기초 모델 추론의 입력과 출력에서 1,000 토큰 과 같습니다. 모델 가격이 계산되고 모니터링되는 방법에 대한 자세한 내용은 생성형 AI 자산에 대한 청구 세부 정보를 참조하세요.

또한 Hugging Face 와 같은 제3자 저장소에서 일부 IBM 기초 모델에 액세스할 수 있습니다. 타사 리포지토리에서 얻은 IBM 파운데이션 모델은 IBM 면책되지 않습니다. watsonx.ai 액세스하는 IBM 파운데이션 모델에 대해서만 IBM 면책합니다. IBM 면책과 관련된 계약상 보호에 대한 자세한 내용은 IBM 고객 관계 계약IBM watsonx.ai 서비스 설명을 참조하세요.

표 2a. IBM watsonx.ai 에서 제공하는 추론용 기초 모델
모델 이름 API 모델 ID 입력
USD/1,000 )
산출
USD/1,000 )
컨텍스트 창
(입력 + 출력 토큰)
기타 정보
granite-13b-instruct-v2 ibm/granite-13b-instruct-v2 $0.0006 $0.0006 8,192 - 모델 카드
' - 웹사이트
' - 연구 논문
'
참고 : 이 기초 모델은 신속하게 조정할 수 있습니다.
granite-8b-japanese ibm/granite-8b-japanese $0.0006 $0.0006 4,096 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-20b-multilingual ibm/granite-20b-multilingual $0.0006 $0.0006 8,192 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-3-2b-instruct ibm/granite-3-2b-instruct $0.0001 $0.0001 131,072 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-3-8b-instruct ibm/granite-3-8b-instruct $0.0002 $0.0002 131,072 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-3-2-8b-instruct ibm/granite-3-2-8b-instruct $0.0002 $0.0002 131,072 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-guardian-3-2b ibm/granite-guardian-3-2b $0.0001 $0.0001 131,072 - 모델 카드
' - 웹사이트
granite-guardian-3-8b ibm/granite-guardian-3-8b $0.0002 $0.0002 131,072 - 모델 카드
' - 웹사이트
granite-3b-code-instruct ibm/granite-3b-code-instruct $0.0006 $0.0006 128,000 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-8b-code-instruct ibm/granite-8b-code-instruct $0.0006 $0.0006 128,000 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-20b-code-instruct ibm/granite-20b-code-instruct $0.0006 $0.0006 8,192 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-34b-code-instruct ibm/granite-34b-code-instruct $0.0006 $0.0006 8,192 - 모델 카드
' - 웹사이트
' - 연구 논문
granite-vision-3-2-2b ibm/granite-vision-3-2-2b $0.0001 $0.0001 131,072 - 모델 카드
' - 웹사이트
' - 연구 논문

 

표 2b. IBM watsonx.ai 에서 제공하는 기초 모델로 미래 가치 예측
모델 이름 API 모델 ID 입력 가격
( USD/1,000 데이터 포인트)
출력 가격
( USD/1,000 데이터 포인트)
컨텍스트 길이
최소 데이터 포인트
기타 정보
granite-ttm-512-96-r2 ibm/granite-ttm-512-96-r2 $0.00013 $0.00038 512 - 모델 카드
' - 웹사이트
' - 연구 논문
'
granite-ttm-1024-96-r2 ibm/granite-ttm-1024-96-r2 $0.00013 $0.00038 1,024 - 모델 카드
' - 웹사이트
' - 연구 논문
'
granite-ttm-1536-96-r2 ibm/granite-ttm-1536-96-r2 $0.00013 $0.00038 1,536 - 모델 카드
' - 웹사이트
' - 연구 논문
'

 

제3자 재단 모델

다음 표에는 watsonx.ai 함께 제공되는 지원되는 타사 파운데이션 모델이 나와 있습니다.

사용량은 자원 단위(RU)로 측정됩니다. 각 단위는 기초 모델 추론의 입력과 출력에서 1,000 토큰 과 같습니다. 모델 가격이 계산되고 모니터링되는 방법에 대한 자세한 내용은 생성형 AI 자산에 대한 청구 세부 정보를 참조하세요.

테이블 3. 와 함께 제공되는 타사 파운데이션 모델( watsonx.ai )
모델 이름 API 모델 ID 제공자 입력
USD/1,000 )
산출
USD/1,000 )
컨텍스트 창
(입력 + 출력 토큰)
기타 정보
allam-1-13b-instruct sdaia/allam-1-13b-instruct 국립 인공 지능 센터 (national center for 인공 지능) 와 사우디 아라비아의 데이터 및 인공 지능 기관 (authority for Data and 인공 지능 $0.0018 $0.0018 4,096 - 모델 카드
elyza-japanese-llama-2-7b-instruct elyza/elyza-japanese-llama-2-7b-instruct ELYZA, 인크. $0.0018 $0.0018 4,096 - 모델 카드
' - note.com 블로그
flan-t5-xl-3b google/flan-t5-xl Google $0.0006 $0.0006 4,096 - 모델 카드
' - 연구 논문
'
참고 : 이 기초 모델은 신속하게 조정할 수 있습니다.
flan-t5-xxl-11b google/flan-t5-xxl Google $0.0018 $0.0018 4,096 - 모델 카드
' - 연구 논문
flan-ul2-20b google/flan-ul2 Google $0.0050 $0.0050 4,096 - 모델 카드
' - UL2 연구 논문
' - 플랜 연구 논문
jais-13b-chat core42/jais-13b-chat 도입/인식 (Inception), Mohamed bin Zayed University of AI (MBZUAI) 및 Cerebras Systems $0.0018 $0.0018 2,048 - 모델 카드
' - 연구 논문
llama-3-3-70b-instruct meta-llama/llama-3-3-70b-instruct Meta $0.00071 $0.00071 131,072 - 모델 카드
' - ' Meta AI 블로그
llama-3-2-1b-instruct meta-llama/llama-3-2-1b-instruct Meta $0.0001 $0.0001 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-3-2-3b-instruct meta-llama/llama-3-2-3b-instruct Meta $0.00015 $0.00015 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-3-2-11b-vision-instruct meta-llama/llama-3-2-11b-vision-instruct Meta $0.00035 $0.00035 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-3-2-90b-vision-instruct meta-llama/llama-3-2-90b-vision-instruct Meta $0.0020 $0.0020 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-guard-3-11b-vision meta-llama/llama-guard-3-11b-vision Meta $0.00035 $0.00035 131,072 - 모델 카드
' - ' Meta AI 블로그
' - 연구 논문
llama-3-1-8b-instruct meta-llama/llama-3-1-8b-instruct Meta $0.0006 $0.0006 131,072 - 모델 카드
' - ' Meta AI 블로그
llama-3-1-70b-instruct meta-llama/llama-3-1-70b-instruct Meta $0.0018 $0.0018 131,072 - 모델 카드
' - ' Meta AI 블로그
llama-3-405b-instruct meta-llama/llama-3-405b-instruct Meta $0.0050 $0.016 16 ,384 - 모델 카드
' - ' Meta AI 블로그
llama-2-13b-chat meta-llama/llama-2-13b-chat Meta $0.0006 $0.0006 4,096 - 모델 카드
' - 연구 논문
mistral-large mistralai/mistral-large Mistral AI $0.003 $0.01 131,072 - 모델 카드
' - Mistral Large 2 블로그 게시물
mistral-small-24b-instruct-2501 mistralai/mistral-small-24b-instruct-2501 Mistral AI $0.00035 $0.00035 32,768 모델 카드
미스트랄 스몰 3용 블로그 포스트
mixtral-8x7b-instruct-v01 mistralai/mixtral-8x7b-instruct-v01 Mistral AI $0.0006 $0.0006 32,768 - 모델 카드
' - 연구 논문
mt0-xxl-13b bigscience/mt0-xxl BigScience $0.0018 $0.0018 4,096 - 모델 카드
' - 연구 논문
pixtral-12b mistralai/pixtral-12b Mistral AI $0.00035 $0.00035 128,000 - 모델 카드
' - Pixtral 12B 블로그 게시물

온디맨드 기반 모델 배포

IBM 가 큐레이팅한 모델 세트에서 기본 모델을 선택하여 조직 전용으로 배포할 수 있습니다.

IBM 필요에 따라 배포하는 기초 모델

다음 표에는 필요에 따라 배포할 수 있는 IBM 의 기초 모델이 나열되어 있습니다.

IBM 의 일부 기초 모델은 Hugging Face 와 같은 제3자 저장소에서도 이용 가능합니다. 타사 리포지토리에서 얻은 IBM 파운데이션 모델은 IBM 면책되지 않습니다. watsonx.ai 액세스하는 IBM 파운데이션 모델에 대해서만 IBM 면책합니다. IBM 면책과 관련된 계약상 보호에 대한 자세한 내용은 IBM 고객 관계 계약IBM watsonx.ai 서비스 설명을 참조하세요.

표 4. 온디맨드 방식으로 배포할 수 있는 IBM 파운데이션 모델 watsonx.ai
모델 이름 시간당 가격(USD) 모델 호스팅 카테고리 컨텍스트 창
(입력 + 출력 토큰)
granite-7b-lab $5.22 소형 4,096
granite-8b-japanese $5.22 소형 4,096
granite-20b-multilingual $5.22 소형 8,192
granite-13b-chat-v2 $5.22 소형 8,192
granite-13b-instruct-v2 $5.22 소형 8,192
granite-3b-code-instruct $5.22 소형 128,000
granite-8b-code-instruct $5.22 소형 128,000
granite-20b-code-instruct $5.22 소형 8,192
granite-34b-code-instruct $5.22 소형 8,192
granite-20b-code-base-schema-linking $5.22 소형 8,192
granite-20b-code-base-sql-gen $5.22 소형 8,192
granite-3-8b-base $5.22 소형 4,096

 

온디맨드 기반의 타사 배포 모델

다음 표에는 필요에 따라 배포할 수 있는 타사 재단 모델이 나열되어 있습니다.

표 5. 타사 파운데이션 모델에서 온디맨드 배포가 가능한 watsonx.ai
모델 이름 제공자 시간당 가격(USD) 모델 호스팅 카테고리 컨텍스트 창
(입력 + 출력 토큰)
allam-1-13b-instruct 국립 인공 지능 센터 (national center for 인공 지능) 와 사우디 아라비아의 데이터 및 인공 지능 기관 (authority for Data and 인공 지능 $5.22 소형 4,096
deepseek-r1-distill-llama-8b DeepSeek 인공지능 $5.22 소형 131,072
deepseek-r1-distill-llama-70b DeepSeek 인공지능 $20.85 대형 131,072
eurollm-1-7b-instruct 전체 프로젝트 $5.22 소형 4,096
eurollm-9b-instruct 전체 프로젝트 $5.22 소형 4,096
flan-t5-xl-3b Google $5.22 소형 4,096
flan-t5-xxl-11b Google $5.22 소형 4,096
flan-ul2-20b Google $5.22 소형 4,096
llama-2-13b-chat Meta $5.22 소형 4,096
llama-2-70b-chat Meta $20.85 대형 4,096
llama-3-8b-instruct Meta $5.22 소형 8,192
llama-3-70b-instruct Meta $20.85 대형 8,192
llama-3-1-8b Meta $5.22 소형 131,072
llama-3-1-8b-instruct Meta $5.22 소형 131,072
llama-3-1-70b-instruct Meta $20.85 대형 131,072
llama-3-3-70b-instruct Meta $10.40 중간 131,072
llama-3-3-70b-instruct-hf Meta $20.85 대형 131,072
mixtral-8x7b-base Mistral AI $10.40 중간 32,768
mixtral-8x7b-instruct-v01 Mistral AI $10.40 중간 32,768
mistral-large-instruct-2407 Mistral AI 55.15 (참고 참조) 대형 131,072
mistral-large-instruct-2411 Mistral AI 55.15 (참고 참조) 대형 131,072
mistral-nemo-instruct-2407 Mistral AI $5.22 소형 131,072
mt0-xxl-13b BigScience $5.22 소형 4,096

 

참고:Mistral AI 에서 mistral-large-instruct-2411 및 mistral-large-instruct-2407 재단 모델을 전용으로 사용하기 위해서는 시간당 액세스 요금이 부과됩니다. 이러한 온디맨드 기반 모델의 호스팅에 대한 총 가격은 액세스 가격과 호스팅 가격의 합계입니다.

호스팅: $ 20.85 + 액세스: $ 34.30 = 총액: $ 55.15 시간당 미화 달러

자세히 알아보기

상위 주제: 인공지능 솔루션