Torna alla versione inglese della documentazioneConversione del testo in incorporazioni di testo
Conversione del testo in incorporazioni di testo
Ultimo aggiornamento: 28 nov 2024
Utilizzare l'API per le incorporazioni di testo watsonx.ai e i modelli di incorporamento disponibili per generare incorporazioni di testo.
Utilizza le funzioni disponibili nella libreria Python watsonx.ai da un notebook in watsonx.ai per convertire il testo in integrazioni di testo.
Il seguente frammento di codice illustra come utilizzare il modello slate-30m-english-rtrvr per convertire le seguenti due righe di testo in incorporazioni di testo:
- Un foundation model è un modello di intelligenza artificiale generativa su larga scala che può essere adattato a un'ampia gamma di attività a valle.
- Generative AI è una classe di algoritmi AI che possono produrre vari tipi di contenuto, inclusi testo, codice sorgente, immagini, audio e dati sintetici.
from ibm_watsonx_ai.foundation_models import Embeddings
from ibm_watsonx_ai.metanames import EmbedTextParamsMetaNames as EmbedParams
my_credentials = {
"url": "https://{region}.ml.cloud.ibm.com",
"apikey": {my-IBM-Cloud-API-key},
}
client = APIClient(my_credentials)
model_id = client.foundation_models.EmbeddingModels.SLATE_30M_ENGLISH_RTRVR
gen_parms = None
project_id = {my-project-ID}
space_id = None
verify = False
# Set the truncate_input_tokens to a value that is equal to or less than the maximum allowed tokens for the embedding model that you are using. If you don't specify this value and the input has more tokens than the model can process, an error is generated.
embed_params = {
EmbedParams.TRUNCATE_INPUT_TOKENS: 128,
EmbedParams.RETURN_OPTIONS: {
'input_text': True
}
}
embedding = Embeddings(
model_id=model_id,
credentials=my_credentials,
params=embed_params,
project_id=project_id,
space_id=space_id,
verify=verify
)
q = [
"A foundation model is a large-scale generative AI model that can be adapted to a wide range of downstream tasks.",
"Generative AI a class of AI algorithms that can produce various types of content including text, source code, imagery, audio, and synthetic data."
]
embedding_vectors = embedding.embed_documents(texts=q)
print(embedding_vectors)
Sostituire {region}
, {my-IBM-Cloud-API-key}
e {my-project-ID}
con valori validi per il proprio ambiente.
Output di esempio
[
[-0.0053823674,-0.018807093,0.009131943, ...-0.010469643,0.0010533642,0.020114796],
[-0.04075534,-0.041552857,0.04326911, ...0.017616473,-0.010064489,0.020788372]
]
Ulteriori informazioni
Argomento principale: Python Python