Unterstützte Gründungsmodelle in watsonx.ai

Letzte Aktualisierung: 10. Apr. 2025
Unterstützte Gründungsmodelle in watsonx.ai

Sie können mit Drittanbietern und IBM -Stiftungsmodellen in IBM watsonx.ai arbeiten. Sie können Fundamentmodelle verwenden, die von IBM bereitgestellt werden und sofort einsatzbereit sind, oder Fundamentmodelle auf Abruf bereitstellen, die ausschließlich für Ihre Organisation verwendet werden.

Wie man ein Modell auswählt

Informationen zu Faktoren, die Ihnen bei der Auswahl eines Modells helfen können, wie z. B. unterstützte Aufgaben und Sprachen, finden Sie unter "Auswahl eines Modells" und "Benchmarks für das Foundation-Modell ".

Foundation-Modelle nach Einsatzmethode

Je nach Bereitstellungsmethode können Sie Foundation-Modelle direkt auf Hardware mit mehreren Mandanten verwenden oder Modelle auf dedizierter Hardware für die Verwendung durch Ihre Organisation bereitstellen. Weitere Informationen zu den verschiedenen Möglichkeiten, Modelle einzusetzen, finden Sie unter "Foundation-Modell-Einsatzmethoden ".

Tabelle 1. Foundation-Modelle nach Einsatzmethode
Einbindung Bereitgestellt mit watsonx.ai
(Pay per Token)
Bereitstellung auf Anfrage
(stundenweise Bezahlung)
IBM - granite-13b-instruct-v2
- granite-8b-japanese
- granite-3-8b-base
- granite-20b-multilingual (Veraltet)
- granite-3-2b-instruct
- granite-3-8b-instruct
- granite-3-2-8b-instruct
- granite-guardian-3-2b
- granite-guardian-3-8b
- granite-3b-code-instruct
- granite-8b-code-instruct
- granite-20b-code-instruct
- granite-34b-code-instruct
- granite-vision-3-2-2b
granite-7b-lab
granite-8b-japanese
granite-13b-chat-v2
granite-13b-instruct-v2
granite-20b-multilingual
granite-3b-code-instruct
granite-8b-code-instruct
granite-20b-code-instruct
granite-34b-code-instruct
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Google flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
flan-t5-xl-3b
flan-t5-xxl-11b
flan-ul2-20b
Meta - lama-4-maverick-17b-128e-instruct-fp8
- llama-4-scout-17b-16e-instruct
- llama-3-3-70b-instruct
- llama-3-2-1b-instruct
- llama-3-2-3b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct
- llama-guard-3-11b-vision-instruct
- llama-3-1-8b-instruct (Veraltet)
- llama-3-1-70b-instruct (Veraltet)
- llama-2-13b-chat (veraltet)
llama-3-3-70b-instruct
llama-3-3-70b-instruct-hf
lama-3-1-70b-instruct
llama-2-13b-chat
llama-2-70b-chat
llama-3-8b-instruct
llama-3-70b-instruct
llama-3-1-8b
llama-3-1-8b-instruct
Mistral AI mistral-large
mistral-small-24b-instruct-2501
mixtral-8x7b-instruct-v01
pixtral-12b
mistral-large-instruct-2407
mistral-large-instruct-2411
mistral-nemo-instruct-2407
mixtral-8x7b-base
mixtral-8x7b-instruct-v01
BigScience mt0-xxl-13b
Code Llama codellama-34b-instruct-hf
DeepSeek KI deepseek-r1-distill-llama-8b
deepseek-r1-distill-llama-70b
ELYZA, Inc. elyza-japanese-llama-2-7b-instruct
Einführung jais-13b-chat
SDAIA allam-1-13b-instruct allam-1-13b-instruct
Projekt "Unified Transcription and Translation for Extended Reality" (UTTER) - eurollm-1-7b-instruct
- eurollm-9b-instruct

Bereitstellung von einsatzbereiten Fundamentmodellen

Eine Sammlung von Open-Source-und IBM -Basismodellen wird in IBM watsonx.aibereitgestellt. Sie können diese Gründungsmodelle im Prompt Lab oder programmatisch abfragen.

IBM fundamentmodelle

In der folgenden Tabelle sind die unterstützten IBM Foundation-Modelle aufgeführt, die IBM für das Inferencing bereitstellt.

Die Nutzung wird in Ressourceneinheiten (RU) gemessen; jede Einheit entspricht 1.000 Token aus dem Input und Output des Inferenzverfahrens des Foundation-Modells. Einzelheiten zur Berechnung und Überwachung der Modellpreise finden Sie unter Abrechnungsdetails für generative KI-Assets.

Sie können auch auf einige IBM -Stiftungsmodelle aus Drittanbieter-Repositorys zugreifen, wie z. B. Hugging Face. IBM Foundation-Modelle, die Sie aus einem Repository eines Drittanbieters beziehen, werden von IBM nicht entschädigt. Nur IBM Foundation-Modelle, auf die Sie über watsonx.ai zugreifen, werden von IBM entschädigt. Weitere Informationen zum vertraglichen Schutz im Zusammenhang mit der Entschädigung IBM finden Sie in der IBM Kundenbeziehungsvereinbarung und der IBM watsonx.ai Servicebeschreibung.

Tabelle 2a. IBM grundmodelle, die mit watsonx.ai für Schlussfolgerungen bereitgestellt wurden
Modellname API-Modell-ID
USD/1,000 Token)

USD/1,000 Token)
Kontextfenster
(Eingabe- und Ausgabe-Token)
Weitere Informationen
granite-13b-instruct-v2 ibm/granite-13b-instruct-v2 $0.0006 $0.0006 8.192 - Modellkarte
- Website
- Forschungsarbeit
Hinweis : Dieses Grundmodell kann schnell angepasst werden.
granite-8b-japanese ibm/granite-8b-japanese $0.0006 $0.0006 4.096 - Musterkarte
- Website
- Forschungspapier
granite-20b-multilingual ibm/granite-20b-multilingual $0.0006 $0.0006 8.192 - Musterkarte
- Website
- Forschungspapier
granite-3-2b-instruct ibm/granite-3-2b-instruct $0.0001 $0.0001 131.072 - Musterkarte
- Website
- Forschungspapier
granite-3-8b-instruct ibm/granite-3-8b-instruct $0.0002 $0.0002 131.072 - Musterkarte
- Website
- Forschungspapier
granite-3-2-8b-instruct ibm/granite-3-2-8b-instruct $0.0002 $0.0002 131.072 - Musterkarte
- Website
- Forschungspapier
granite-guardian-3-2b ibm/granite-guardian-3-2b $0.0001 $0.0001 131.072 - Musterkarte
- Website
granite-guardian-3-8b ibm/granite-guardian-3-8b $0.0002 $0.0002 131.072 - Musterkarte
- Website
granite-3b-code-instruct ibm/granite-3b-code-instruct $0.0006 $0.0006 128.000 - Musterkarte
- Website
- Forschungspapier
granite-8b-code-instruct ibm/granite-8b-code-instruct $0.0006 $0.0006 128.000 - Musterkarte
- Website
- Forschungspapier
granite-20b-code-instruct ibm/granite-20b-code-instruct $0.0006 $0.0006 8.192 - Musterkarte
- Website
- Forschungspapier
granite-34b-code-instruct ibm/granite-34b-code-instruct $0.0006 $0.0006 8.192 - Musterkarte
- Website
- Forschungspapier
granite-vision-3-2-2b ibm/granite-vision-3-2-2b $0.0001 $0.0001 131.072 - Musterkarte
- Website
- Forschungspapier

 

Tabelle 2b. IBM grundmodelle, die mit watsonx.ai für die Prognose zukünftiger Werte bereitgestellt wurden
Modellname API-Modell-ID Eingangspreis
( USD/1,000 Datenpunkte)
Ausgabepreis
( USD/1,000 Datenpunkte)
Kontextlänge
Mindestanzahl Datenpunkte
Weitere Informationen
granite-ttm-512-96-r2 ibm/granite-ttm-512-96-r2 $0.00013 $0.00038 512 - Modellkarte
- Website
- Forschungsarbeit
granite-ttm-1024-96-r2 ibm/granite-ttm-1024-96-r2 $0.00013 $0.00038 1.024 - Modellkarte
- Website
- Forschungsarbeit
granite-ttm-1536-96-r2 ibm/granite-ttm-1536-96-r2 $0.00013 $0.00038 1.536 - Modellkarte
- Website
- Forschungsarbeit

 

Drittstiftungsmodelle

In der folgenden Tabelle sind die unterstützten Foundation-Modelle von Drittanbietern aufgeführt, die mit watsonx.ai bereitgestellt werden.

Die Nutzung wird in Ressourceneinheiten (RU) gemessen; jede Einheit entspricht 1.000 Token aus dem Input und Output des Inferenzverfahrens des Foundation-Modells. Einzelheiten zur Berechnung und Überwachung der Modellpreise finden Sie unter Abrechnungsdetails für generative KI-Assets.

Tabelle 3. Mit watsonx.ai bereitgestellte Stiftungsmodelle von Drittanbietern
Modellname API-Modell-ID Einbindung
USD/1,000 Token)

USD/1,000 Token)
Kontextfenster
(Eingabe- und Ausgabe-Token)
Weitere Informationen
allam-1-13b-instruct sdaia/allam-1-13b-instruct Nationales Zentrum für Künstliche Intelligenz und saudische Behörde für Daten und Künstliche Intelligenz $0.0018 $0.0018 4.096 - Modellkarte
elyza-japanese-llama-2-7b-instruct elyza/elyza-japanese-llama-2-7b-instruct ELYZA, Inc. $0.0018 $0.0018 4.096 - Musterkarte
- Blog auf note.com
flan-t5-xl-3b google/flan-t5-xl Google $0.0006 $0.0006 4.096 - Musterkarte
- Forschungspapier
Hinweis : Dieses Grundmodell kann schnell angepasst werden.
flan-t5-xxl-11b google/flan-t5-xxl Google $0.0018 $0.0018 4.096 - Musterkarte
- Forschungspapier
flan-ul2-20b google/flan-ul2 Google $0.0050 $0.0050 4.096 - Musterkarte
- ForschungspapierUL2
- Forschungspapier Flan
jais-13b-chat core42/jais-13b-chat Inception, Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) und Cerebras Systems $0.0018 $0.0018 2.048 - Musterkarte
- Forschungspapier
llama-4-maverick-17b-128e-instruct-fp8 meta-llama/llama-4-maverick-17b-128e-instruct-fp Meta Keine Kosten während der Vorschau Keine Kosten während der Vorschau 131.072 - Musterkarte
- ' Meta AI Blog
llama-4-scout-17b-16e-instruct meta-llama/llama-4-scout-17b-16e-instruct Meta Keine Kosten während der Vorschau Keine Kosten während der Vorschau 131.072 - Musterkarte
- ' Meta AI Blog
llama-3-3-70b-instruct meta-llama/llama-3-3-70b-instruct Meta $0.00071 $0.00071 131.072 - Musterkarte
- ' Meta AI Blog
llama-3-2-1b-instruct meta-llama/llama-3-2-1b-instruct Meta $0.0001 $0.0001 131.072 - Musterkarte
- ' Meta AI blog
- Forschungspapier
llama-3-2-3b-instruct meta-llama/llama-3-2-3b-instruct Meta $0.00015 $0.00015 131.072 - Musterkarte
- ' Meta AI blog
- Forschungspapier
llama-3-2-11b-vision-instruct meta-llama/llama-3-2-11b-vision-instruct Meta $0.00035 $0.00035 131.072 - Musterkarte
- ' Meta AI blog
- Forschungspapier
llama-3-2-90b-vision-instruct meta-llama/llama-3-2-90b-vision-instruct Meta $0.0020 $0.0020 131.072 - Musterkarte
- ' Meta AI blog
- Forschungspapier
llama-guard-3-11b-vision meta-llama/llama-guard-3-11b-vision Meta $0.00035 $0.00035 131.072 - Musterkarte
- ' Meta AI blog
- Forschungspapier
llama-3-1-8b-instruct meta-llama/llama-3-1-8b-instruct Meta $0.0006 $0.0006 131.072 - Musterkarte
- ' Meta AI Blog
llama-3-1-70b-instruct meta-llama/llama-3-1-70b-instruct Meta $0.0018 $0.0018 131.072 - Musterkarte
- ' Meta AI Blog
llama-3-405b-instruct meta-llama/llama-3-405b-instruct Meta $0.0050 $0.016 16.384 - Musterkarte
- ' Meta AI Blog
llama-2-13b-chat meta-llama/llama-2-13b-chat Meta $0.0006 $0.0006 4.096 - Musterkarte
- Forschungspapier
mistral-large mistralai/mistral-large Mistral AI $0.003 $0.01 131.072 - Modellkarte
- Blogbeitrag für Mistral Large 2
mistral-small-24b-instruct-2501 mistralai/mistral-small-24b-instruct-2501 Mistral AI $0.00035 $0.00035 32.768 Musterkarte
Blogbeitrag für Mistral Small 3
mixtral-8x7b-instruct-v01 mistralai/mixtral-8x7b-instruct-v01 Mistral AI $0.0006 $0.0006 32.768 - Musterkarte
- Forschungspapier
mt0-xxl-13b bigscience/mt0-xxl BigScience $0.0018 $0.0018 4.096 - Musterkarte
- Forschungspapier
pixtral-12b mistralai/pixtral-12b Mistral AI $0.00035 $0.00035 128.000 - Modellkarte
- Blogbeitrag für Pixtral 12B

Einsatz von On-Demand-Gründungsmodellen

Sie können mit einem Grundmodell aus einer Reihe von IBM -kuratierten Modellen arbeiten, die ausschließlich für Ihre Organisation bereitgestellt werden.

IBM bei Bedarf Stiftungsmodelle einsetzen

In der folgenden Tabelle sind die IBM -Stiftungsmodelle aufgeführt, die Sie bei Bedarf einsetzen können.

Einige IBM -Grundmodelle sind auch in Drittanbieter-Repositorien wie Hugging Face verfügbar. IBM Foundation-Modelle, die Sie aus einem Repository eines Drittanbieters beziehen, werden von IBM nicht entschädigt. Nur IBM Foundation-Modelle, auf die Sie über watsonx.ai zugreifen, werden von IBM entschädigt. Weitere Informationen zum vertraglichen Schutz im Zusammenhang mit der Entschädigung IBM finden Sie in der IBM Kundenbeziehungsvereinbarung und der IBM watsonx.ai Servicebeschreibung.

Tabelle 4. IBM, die auf Anfrage in watsonx.ai bereitgestellt werden können
Modellname Preis pro Stunde in USD Kategorie Modell-Hosting Kontextfenster
(Eingabe- und Ausgabe-Token)
granite-7b-lab $5.22 Klein 4.096
granite-8b-japanese $5.22 Klein 4.096
granite-20b-multilingual $5.22 Klein 8.192
granite-13b-chat-v2 $5.22 Klein 8.192
granite-13b-instruct-v2 $5.22 Klein 8.192
granite-3b-code-instruct $5.22 Klein 128.000
granite-8b-code-instruct $5.22 Klein 128.000
granite-20b-code-instruct $5.22 Klein 8.192
granite-34b-code-instruct $5.22 Klein 8.192
granite-20b-code-base-schema-linking $5.22 Klein 8.192
granite-20b-code-base-sql-gen $5.22 Klein 8.192
granite-3-8b-base $5.22 Klein 4.096

 

Bereitstellung von Drittanbietern auf Abruf-Stiftungsmodellen

In der folgenden Tabelle sind die Drittanbieter-Stiftungsmodelle aufgeführt, die Sie bei Bedarf einsetzen können.

Tabelle 5. Basismodelle von Drittanbietern, die bei Bedarf in watsonx.ai eingesetzt werden können
Modellname Einbindung Preis pro Stunde in USD Kategorie Modell-Hosting Kontextfenster
(Eingabe- und Ausgabe-Token)
allam-1-13b-instruct Nationales Zentrum für Künstliche Intelligenz und saudische Behörde für Daten und Künstliche Intelligenz $5.22 Klein 4.096
codellama-34b-instruct-hf Code Llama $10.40 Mittel 16.384
deepseek-r1-distill-llama-8b DeepSeek KI $5.22 Klein 131.072
deepseek-r1-distill-llama-70b DeepSeek KI $20.85 Groß 131.072
eurollm-1-7b-instruct Utter-Projekt $5.22 Klein 4.096
eurollm-9b-instruct Utter-Projekt $5.22 Klein 4.096
flan-t5-xl-3b Google $5.22 Klein 4.096
flan-t5-xxl-11b Google $5.22 Klein 4.096
flan-ul2-20b Google $5.22 Klein 4.096
llama-2-13b-chat Meta $5.22 Klein 4.096
llama-2-70b-chat Meta $20.85 Groß 4.096
llama-3-8b-instruct Meta $5.22 Klein 8.192
llama-3-70b-instruct Meta $20.85 Groß 8.192
llama-3-1-8b Meta $5.22 Klein 131.072
llama-3-1-8b-instruct Meta $5.22 Klein 131.072
llama-3-1-70b-instruct Meta $20.85 Groß 131.072
llama-3-3-70b-instruct Meta $10.40 Mittel 131.072
llama-3-3-70b-instruct-hf Meta $20.85 Groß 131.072
mixtral-8x7b-base Mistral AI $10.40 Mittel 32.768
mixtral-8x7b-instruct-v01 Mistral AI $10.40 Mittel 32.768
mistral-large-instruct-2407 Mistral AI $ 55.15 (Siehe Hinweis.) Groß 131.072
mistral-large-instruct-2411 Mistral AI $ 55.15 (Siehe Hinweis.) Groß 131.072
mistral-nemo-instruct-2407 Mistral AI $5.22 Klein 131.072
mt0-xxl-13b BigScience $5.22 Klein 4.096

 

Hinweis:Für die Bereitstellung der Stiftungsmodelle mistral-large-instruct-2411 und mistral-large-instruct-2407 von Mistral AI für den dedizierten Gebrauch wird eine stündliche Zugangsgebühr erhoben. Der Gesamtpreis für die Bereitstellung dieser On-Demand-Foundation-Modelle setzt sich aus dem Zugangspreis und dem Hosting-Preis zusammen.

Hosting: $ 20.85 + Zugang: $ 34.30 = Gesamt: $ 55.15 USD pro Stunde

Weitere Informationen

Übergeordnetes Thema: Generative KI-Lösungen