Zurück zur englischen Version der DokumentationText in Texteinbettungen konvertieren
Text in Texteinbettungen konvertieren
Letzte Aktualisierung: 28. Nov. 2024
Verwenden Sie die watsonx.ai API für Texteinbettungen und die verfügbaren Einbettungsmodelle, um Texteinbettungen zu erzeugen.
Verwenden Sie Funktionen, die in der Python -Bibliothek watsonx.ai in einem Notebook in watsonx.ai verfügbar sind, um Text in Texteinbettungen zu konvertieren.
Das folgende Code-Snippet veranschaulicht die Verwendung des Modells slate-30m-english-rtrvr zum Konvertieren der folgenden beiden Textzeilen in Texteinbettungen:
- Ein foundation model ist ein groß angelegtes generatives KI-Modell, das an eine breite Palette von nachgelagerten Aufgaben angepasst werden kann.
- Generative AI ist eine Klasse von KI-Algorithmen, die verschiedene Inhaltstypen wie Text, Quellcode, Bilder, Audio und synthetische Daten erstellen können.
from ibm_watsonx_ai.foundation_models import Embeddings
from ibm_watsonx_ai.metanames import EmbedTextParamsMetaNames as EmbedParams
my_credentials = {
"url": "https://{region}.ml.cloud.ibm.com",
"apikey": {my-IBM-Cloud-API-key},
}
client = APIClient(my_credentials)
model_id = client.foundation_models.EmbeddingModels.SLATE_30M_ENGLISH_RTRVR
gen_parms = None
project_id = {my-project-ID}
space_id = None
verify = False
# Set the truncate_input_tokens to a value that is equal to or less than the maximum allowed tokens for the embedding model that you are using. If you don't specify this value and the input has more tokens than the model can process, an error is generated.
embed_params = {
EmbedParams.TRUNCATE_INPUT_TOKENS: 128,
EmbedParams.RETURN_OPTIONS: {
'input_text': True
}
}
embedding = Embeddings(
model_id=model_id,
credentials=my_credentials,
params=embed_params,
project_id=project_id,
space_id=space_id,
verify=verify
)
q = [
"A foundation model is a large-scale generative AI model that can be adapted to a wide range of downstream tasks.",
"Generative AI a class of AI algorithms that can produce various types of content including text, source code, imagery, audio, and synthetic data."
]
embedding_vectors = embedding.embed_documents(texts=q)
print(embedding_vectors)
Ersetzen Sie {region}
, {my-IBM-Cloud-API-key}
und {my-project-ID}
durch gültige Werte für Ihre Umgebung.
Beispielausgabe
[
[-0.0053823674,-0.018807093,0.009131943, ...-0.010469643,0.0010533642,0.020114796],
[-0.04075534,-0.041552857,0.04326911, ...0.017616473,-0.010064489,0.020788372]
]
Weitere Informationen
Übergeordnetes Thema: Python -Bibliothek