Unterstützte Gründungsmodelle in watsonx.ai

Letzte Aktualisierung: 10. Apr. 2025

Sie können mit Drittanbietern und IBM -Stiftungsmodellen in IBM watsonx.ai arbeiten. Sie können Fundamentmodelle verwenden, die von IBM bereitgestellt werden und sofort einsatzbereit sind, oder Fundamentmodelle auf Abruf bereitstellen, die ausschließlich für Ihre Organisation verwendet werden.

Wie man ein Modell auswählt

Informationen zu Faktoren, die Ihnen bei der Auswahl eines Modells helfen können, wie z. B. unterstützte Aufgaben und Sprachen, finden Sie unter "Auswahl eines Modells" und "Benchmarks für das Foundation-Modell ".

Foundation-Modelle nach Einsatzmethode

Je nach Bereitstellungsmethode können Sie Foundation-Modelle direkt auf Hardware mit mehreren Mandanten verwenden oder Modelle auf dedizierter Hardware für die Verwendung durch Ihre Organisation bereitstellen. Weitere Informationen zu den verschiedenen Möglichkeiten, Modelle einzusetzen, finden Sie unter "Foundation-Modell-Einsatzmethoden ".

Tabelle 1. Foundation-Modelle nach Einsatzmethode
Einbindung	Bereitgestellt mit watsonx.ai (Pay per Token)	Bereitstellung auf Anfrage (stundenweise Bezahlung)
IBM	- granite-13b-instruct-v2 - granite-8b-japanese - granite-3-8b-base - granite-20b-multilingual (Veraltet) - granite-3-2b-instruct - granite-3-8b-instruct - granite-3-2-8b-instruct - granite-guardian-3-2b - granite-guardian-3-8b - granite-3b-code-instruct - granite-8b-code-instruct - granite-20b-code-instruct - granite-34b-code-instruct - granite-vision-3-2-2b	• granite-7b-lab • granite-8b-japanese • granite-13b-chat-v2 • granite-13b-instruct-v2 • granite-20b-multilingual • granite-3b-code-instruct • granite-8b-code-instruct • granite-20b-code-instruct • granite-34b-code-instruct • granite-20b-code-base-schema-linking • granite-20b-code-base-sql-gen
Google	• flan-t5-xl-3b • flan-t5-xxl-11b • flan-ul2-20b	• flan-t5-xl-3b • flan-t5-xxl-11b • flan-ul2-20b
Meta	- lama-4-maverick-17b-128e-instruct-fp8 - llama-4-scout-17b-16e-instruct - llama-3-3-70b-instruct - llama-3-2-1b-instruct - llama-3-2-3b-instruct - llama-3-2-11b-vision-instruct - llama-3-2-90b-vision-instruct - llama-guard-3-11b-vision-instruct - llama-3-1-8b-instruct (Veraltet) - llama-3-1-70b-instruct (Veraltet) - llama-2-13b-chat (veraltet)	• llama-3-3-70b-instruct • llama-3-3-70b-instruct-hf • lama-3-1-70b-instruct • llama-2-13b-chat • llama-2-70b-chat • llama-3-8b-instruct • llama-3-70b-instruct • llama-3-1-8b • llama-3-1-8b-instruct
Mistral AI	• mistral-large • mistral-small-24b-instruct-2501 • mixtral-8x7b-instruct-v01 • pixtral-12b	• mistral-large-instruct-2407 • mistral-large-instruct-2411 • mistral-nemo-instruct-2407 • mixtral-8x7b-base • mixtral-8x7b-instruct-v01
BigScience		• mt0-xxl-13b
Code Llama		• codellama-34b-instruct-hf
DeepSeek KI		• deepseek-r1-distill-llama-8b • deepseek-r1-distill-llama-70b
ELYZA, Inc.	• elyza-japanese-llama-2-7b-instruct
Einführung	• jais-13b-chat
SDAIA	• allam-1-13b-instruct	• allam-1-13b-instruct
Projekt "Unified Transcription and Translation for Extended Reality" (UTTER)		- eurollm-1-7b-instruct - eurollm-9b-instruct

Bereitstellung von einsatzbereiten Fundamentmodellen

Eine Sammlung von Open-Source-und IBM -Basismodellen wird in IBM watsonx.aibereitgestellt. Sie können diese Gründungsmodelle im Prompt Lab oder programmatisch abfragen.

IBM fundamentmodelle

In der folgenden Tabelle sind die unterstützten IBM Foundation-Modelle aufgeführt, die IBM für das Inferencing bereitstellt.

Die Nutzung wird in Ressourceneinheiten (RU) gemessen; jede Einheit entspricht 1.000 Token aus dem Input und Output des Inferenzverfahrens des Foundation-Modells. Einzelheiten zur Berechnung und Überwachung der Modellpreise finden Sie unter Abrechnungsdetails für generative KI-Assets.

Sie können auch auf einige IBM -Stiftungsmodelle aus Drittanbieter-Repositorys zugreifen, wie z. B. Hugging Face. IBM Foundation-Modelle, die Sie aus einem Repository eines Drittanbieters beziehen, werden von IBM nicht entschädigt. Nur IBM Foundation-Modelle, auf die Sie über watsonx.ai zugreifen, werden von IBM entschädigt. Weitere Informationen zum vertraglichen Schutz im Zusammenhang mit der Entschädigung IBM finden Sie in der IBM Kundenbeziehungsvereinbarung und der IBM watsonx.ai Servicebeschreibung.

Tabelle 2a. IBM grundmodelle, die mit watsonx.ai für Schlussfolgerungen bereitgestellt wurden
Modellname	API-Modell-ID	USD/1,000 Token)	USD/1,000 Token)	Kontextfenster (Eingabe- und Ausgabe-Token)	Weitere Informationen
granite-13b-instruct-v2	`ibm/granite-13b-instruct-v2`	$0.0006	$0.0006	8.192	- Modellkarte - Website - Forschungsarbeit Hinweis : Dieses Grundmodell kann schnell angepasst werden.
granite-8b-japanese	`ibm/granite-8b-japanese`	$0.0006	$0.0006	4.096	- Musterkarte - Website - Forschungspapier
granite-20b-multilingual	`ibm/granite-20b-multilingual`	$0.0006	$0.0006	8.192	- Musterkarte - Website - Forschungspapier
granite-3-2b-instruct	`ibm/granite-3-2b-instruct`	$0.0001	$0.0001	131.072	- Musterkarte - Website - Forschungspapier
granite-3-8b-instruct	`ibm/granite-3-8b-instruct`	$0.0002	$0.0002	131.072	- Musterkarte - Website - Forschungspapier
granite-3-2-8b-instruct	`ibm/granite-3-2-8b-instruct`	$0.0002	$0.0002	131.072	- Musterkarte - Website - Forschungspapier
granite-guardian-3-2b	`ibm/granite-guardian-3-2b`	$0.0001	$0.0001	131.072	- Musterkarte - Website
granite-guardian-3-8b	`ibm/granite-guardian-3-8b`	$0.0002	$0.0002	131.072	- Musterkarte - Website
granite-3b-code-instruct	`ibm/granite-3b-code-instruct`	$0.0006	$0.0006	128.000	- Musterkarte - Website - Forschungspapier
granite-8b-code-instruct	`ibm/granite-8b-code-instruct`	$0.0006	$0.0006	128.000	- Musterkarte - Website - Forschungspapier
granite-20b-code-instruct	`ibm/granite-20b-code-instruct`	$0.0006	$0.0006	8.192	- Musterkarte - Website - Forschungspapier
granite-34b-code-instruct	`ibm/granite-34b-code-instruct`	$0.0006	$0.0006	8.192	- Musterkarte - Website - Forschungspapier
granite-vision-3-2-2b	`ibm/granite-vision-3-2-2b`	$0.0001	$0.0001	131.072	- Musterkarte - Website - Forschungspapier

Tabelle 2b. IBM grundmodelle, die mit watsonx.ai für die Prognose zukünftiger Werte bereitgestellt wurden
Modellname	API-Modell-ID	Eingangspreis ( USD/1,000 Datenpunkte)	Ausgabepreis ( USD/1,000 Datenpunkte)	Kontextlänge Mindestanzahl Datenpunkte	Weitere Informationen
granite-ttm-512-96-r2	`ibm/granite-ttm-512-96-r2`	$0.00013	$0.00038	512	- Modellkarte - Website - Forschungsarbeit
granite-ttm-1024-96-r2	`ibm/granite-ttm-1024-96-r2`	$0.00013	$0.00038	1.024	- Modellkarte - Website - Forschungsarbeit
granite-ttm-1536-96-r2	`ibm/granite-ttm-1536-96-r2`	$0.00013	$0.00038	1.536	- Modellkarte - Website - Forschungsarbeit

Drittstiftungsmodelle

In der folgenden Tabelle sind die unterstützten Foundation-Modelle von Drittanbietern aufgeführt, die mit watsonx.ai bereitgestellt werden.

Tabelle 3. Mit watsonx.ai bereitgestellte Stiftungsmodelle von Drittanbietern
Modellname	API-Modell-ID	Einbindung	USD/1,000 Token)	USD/1,000 Token)	Kontextfenster (Eingabe- und Ausgabe-Token)	Weitere Informationen
allam-1-13b-instruct	`sdaia/allam-1-13b-instruct`	Nationales Zentrum für Künstliche Intelligenz und saudische Behörde für Daten und Künstliche Intelligenz	$0.0018	$0.0018	4.096	- Modellkarte
elyza-japanese-llama-2-7b-instruct	`elyza/elyza-japanese-llama-2-7b-instruct`	ELYZA, Inc.	$0.0018	$0.0018	4.096	- Musterkarte - Blog auf note.com
flan-t5-xl-3b	`google/flan-t5-xl`	Google	$0.0006	$0.0006	4.096	- Musterkarte - Forschungspapier Hinweis : Dieses Grundmodell kann schnell angepasst werden.
flan-t5-xxl-11b	`google/flan-t5-xxl`	Google	$0.0018	$0.0018	4.096	- Musterkarte - Forschungspapier
flan-ul2-20b	`google/flan-ul2`	Google	$0.0050	$0.0050	4.096	- Musterkarte - ForschungspapierUL2 - Forschungspapier Flan
jais-13b-chat	`core42/jais-13b-chat`	Inception, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) und Cerebras Systems	$0.0018	$0.0018	2.048	- Musterkarte - Forschungspapier
llama-4-maverick-17b-128e-instruct-fp8	`meta-llama/llama-4-maverick-17b-128e-instruct-fp`	Meta	Keine Kosten während der Vorschau	Keine Kosten während der Vorschau	131.072	- Musterkarte - ' Meta AI Blog
llama-4-scout-17b-16e-instruct	`meta-llama/llama-4-scout-17b-16e-instruct`	Meta	Keine Kosten während der Vorschau	Keine Kosten während der Vorschau	131.072	- Musterkarte - ' Meta AI Blog
llama-3-3-70b-instruct	`meta-llama/llama-3-3-70b-instruct`	Meta	$0.00071	$0.00071	131.072	- Musterkarte - ' Meta AI Blog
llama-3-2-1b-instruct	`meta-llama/llama-3-2-1b-instruct`	Meta	$0.0001	$0.0001	131.072	- Musterkarte - ' Meta AI blog - Forschungspapier
llama-3-2-3b-instruct	`meta-llama/llama-3-2-3b-instruct`	Meta	$0.00015	$0.00015	131.072	- Musterkarte - ' Meta AI blog - Forschungspapier
llama-3-2-11b-vision-instruct	`meta-llama/llama-3-2-11b-vision-instruct`	Meta	$0.00035	$0.00035	131.072	- Musterkarte - ' Meta AI blog - Forschungspapier
llama-3-2-90b-vision-instruct	`meta-llama/llama-3-2-90b-vision-instruct`	Meta	$0.0020	$0.0020	131.072	- Musterkarte - ' Meta AI blog - Forschungspapier
llama-guard-3-11b-vision	`meta-llama/llama-guard-3-11b-vision`	Meta	$0.00035	$0.00035	131.072	- Musterkarte - ' Meta AI blog - Forschungspapier
llama-3-1-8b-instruct	`meta-llama/llama-3-1-8b-instruct`	Meta	$0.0006	$0.0006	131.072	- Musterkarte - ' Meta AI Blog
llama-3-1-70b-instruct	`meta-llama/llama-3-1-70b-instruct`	Meta	$0.0018	$0.0018	131.072	- Musterkarte - ' Meta AI Blog
llama-3-405b-instruct	`meta-llama/llama-3-405b-instruct`	Meta	$0.0050	$0.016	16.384	- Musterkarte - ' Meta AI Blog
llama-2-13b-chat	`meta-llama/llama-2-13b-chat`	Meta	$0.0006	$0.0006	4.096	- Musterkarte - Forschungspapier
mistral-large	`mistralai/mistral-large`	Mistral AI	$0.003	$0.01	131.072	- Modellkarte - Blogbeitrag für Mistral Large 2
mistral-small-24b-instruct-2501	`mistralai/mistral-small-24b-instruct-2501`	Mistral AI	$0.00035	$0.00035	32.768	• Musterkarte • Blogbeitrag für Mistral Small 3
mixtral-8x7b-instruct-v01	`mistralai/mixtral-8x7b-instruct-v01`	Mistral AI	$0.0006	$0.0006	32.768	- Musterkarte - Forschungspapier
mt0-xxl-13b	`bigscience/mt0-xxl`	BigScience	$0.0018	$0.0018	4.096	- Musterkarte - Forschungspapier
pixtral-12b	`mistralai/pixtral-12b`	Mistral AI	$0.00035	$0.00035	128.000	- Modellkarte - Blogbeitrag für Pixtral 12B

Einsatz von On-Demand-Gründungsmodellen

Sie können mit einem Grundmodell aus einer Reihe von IBM -kuratierten Modellen arbeiten, die ausschließlich für Ihre Organisation bereitgestellt werden.

IBM bei Bedarf Stiftungsmodelle einsetzen

In der folgenden Tabelle sind die IBM -Stiftungsmodelle aufgeführt, die Sie bei Bedarf einsetzen können.

Einige IBM -Grundmodelle sind auch in Drittanbieter-Repositorien wie Hugging Face verfügbar. IBM Foundation-Modelle, die Sie aus einem Repository eines Drittanbieters beziehen, werden von IBM nicht entschädigt. Nur IBM Foundation-Modelle, auf die Sie über watsonx.ai zugreifen, werden von IBM entschädigt. Weitere Informationen zum vertraglichen Schutz im Zusammenhang mit der Entschädigung IBM finden Sie in der IBM Kundenbeziehungsvereinbarung und der IBM watsonx.ai Servicebeschreibung.

Tabelle 4. IBM, die auf Anfrage in watsonx.ai bereitgestellt werden können
Modellname	Preis pro Stunde in USD	Kategorie Modell-Hosting	Kontextfenster (Eingabe- und Ausgabe-Token)
granite-7b-lab	$5.22	Klein	4.096
granite-8b-japanese	$5.22	Klein	4.096
granite-20b-multilingual	$5.22	Klein	8.192
granite-13b-chat-v2	$5.22	Klein	8.192
granite-13b-instruct-v2	$5.22	Klein	8.192
granite-3b-code-instruct	$5.22	Klein	128.000
granite-8b-code-instruct	$5.22	Klein	128.000
granite-20b-code-instruct	$5.22	Klein	8.192
granite-34b-code-instruct	$5.22	Klein	8.192
granite-20b-code-base-schema-linking	$5.22	Klein	8.192
granite-20b-code-base-sql-gen	$5.22	Klein	8.192
granite-3-8b-base	$5.22	Klein	4.096

Bereitstellung von Drittanbietern auf Abruf-Stiftungsmodellen

In der folgenden Tabelle sind die Drittanbieter-Stiftungsmodelle aufgeführt, die Sie bei Bedarf einsetzen können.

Tabelle 5. Basismodelle von Drittanbietern, die bei Bedarf in watsonx.ai eingesetzt werden können
Modellname	Einbindung	Preis pro Stunde in USD	Kategorie Modell-Hosting	Kontextfenster (Eingabe- und Ausgabe-Token)
allam-1-13b-instruct	Nationales Zentrum für Künstliche Intelligenz und saudische Behörde für Daten und Künstliche Intelligenz	$5.22	Klein	4.096
codellama-34b-instruct-hf	Code Llama	$10.40	Mittel	16.384
deepseek-r1-distill-llama-8b	DeepSeek KI	$5.22	Klein	131.072
deepseek-r1-distill-llama-70b	DeepSeek KI	$20.85	Groß	131.072
eurollm-1-7b-instruct	Utter-Projekt	$5.22	Klein	4.096
eurollm-9b-instruct	Utter-Projekt	$5.22	Klein	4.096
flan-t5-xl-3b	Google	$5.22	Klein	4.096
flan-t5-xxl-11b	Google	$5.22	Klein	4.096
flan-ul2-20b	Google	$5.22	Klein	4.096
llama-2-13b-chat	Meta	$5.22	Klein	4.096
llama-2-70b-chat	Meta	$20.85	Groß	4.096
llama-3-8b-instruct	Meta	$5.22	Klein	8.192
llama-3-70b-instruct	Meta	$20.85	Groß	8.192
llama-3-1-8b	Meta	$5.22	Klein	131.072
llama-3-1-8b-instruct	Meta	$5.22	Klein	131.072
llama-3-1-70b-instruct	Meta	$20.85	Groß	131.072
llama-3-3-70b-instruct	Meta	$10.40	Mittel	131.072
llama-3-3-70b-instruct-hf	Meta	$20.85	Groß	131.072
mixtral-8x7b-base	Mistral AI	$10.40	Mittel	32.768
mixtral-8x7b-instruct-v01	Mistral AI	$10.40	Mittel	32.768
mistral-large-instruct-2407	Mistral AI	$ 55.15 (Siehe Hinweis.)	Groß	131.072
mistral-large-instruct-2411	Mistral AI	$ 55.15 (Siehe Hinweis.)	Groß	131.072
mistral-nemo-instruct-2407	Mistral AI	$5.22	Klein	131.072
mt0-xxl-13b	BigScience	$5.22	Klein	4.096

Hinweis:

Für die Bereitstellung der Stiftungsmodelle mistral-large-instruct-2411 und mistral-large-instruct-2407 von Mistral AI für den dedizierten Gebrauch wird eine stündliche Zugangsgebühr erhoben. Der Gesamtpreis für die Bereitstellung dieser On-Demand-Foundation-Modelle setzt sich aus dem Zugangspreis und dem Hosting-Preis zusammen.

Hosting: $ 20.85 + Zugang: $ 34.30 = Gesamt: $ 55.15 USD pro Stunde

Weitere Informationen

IBM fundamentmodelle
Drittstiftungsmodelle
Weitere Informationen zu den von IBM bereitgestellten Einbettungs- und Reranking-Textmodellen finden Sie unter "Unterstützte Encoder-Modelle ".
Eine Liste der in den einzelnen regionalen Rechenzentren verfügbaren Modelle finden Sie unter "Regionale Verfügbarkeit von Foundation-Modellen ".
Weitere Informationen zu den Preisen für das Foundation-Modell finden Sie unter "Rechnungsdetails für generative KI-Assets ".
Informationen zu Preisen und Tarifbegrenzungen finden Sie unter watsonx.ai Laufzeitpläne.

Übergeordnetes Thema: Generative KI-Lösungen

War das Thema hilfreich?

0/1000

Wie man ein Modell auswähltCopy link to section

Foundation-Modelle nach EinsatzmethodeCopy link to section

Bereitstellung von einsatzbereiten FundamentmodellenCopy link to section

IBM fundamentmodelleCopy link to section

DrittstiftungsmodelleCopy link to section

Einsatz von On-Demand-GründungsmodellenCopy link to section

IBM bei Bedarf Stiftungsmodelle einsetzenCopy link to section

Bereitstellung von Drittanbietern auf Abruf-StiftungsmodellenCopy link to section

Weitere InformationenCopy link to section