Volver a la versión inglesa de la documentación
Conversión de texto a incorporaciones de texto
Conversión de texto a incorporaciones de texto
Última actualización: 28 nov 2024
Utiliza la API de incrustación de texto watsonx.ai y los modelos de incrustación disponibles para generar incrustaciones de texto.
Utilice las funciones que están disponibles en la biblioteca watsonx.ai Python desde un cuaderno en watsonx.ai para convertir texto en incorporaciones de texto.
El siguiente fragmento de código ilustra cómo utilizar el modelo slate-30m-english-rtrvr para convertir las dos líneas de texto siguientes en incorporaciones de texto:
- Un foundation model es un modelo generativo de IA a gran escala que puede adaptarse a una amplia gama de tareas posteriores.
- IA generativa una clase de algoritmos de IA que puede producir varios tipos de contenido, incluyendo texto, código fuente, imágenes, audio y datos sintéticos.
from ibm_watsonx_ai.foundation_models import Embeddings
from ibm_watsonx_ai.metanames import EmbedTextParamsMetaNames as EmbedParams
my_credentials = {
"url": "https://{region}.ml.cloud.ibm.com",
"apikey": {my-IBM-Cloud-API-key},
}
client = APIClient(my_credentials)
model_id = client.foundation_models.EmbeddingModels.SLATE_30M_ENGLISH_RTRVR
gen_parms = None
project_id = {my-project-ID}
space_id = None
verify = False
# Set the truncate_input_tokens to a value that is equal to or less than the maximum allowed tokens for the embedding model that you are using. If you don't specify this value and the input has more tokens than the model can process, an error is generated.
embed_params = {
EmbedParams.TRUNCATE_INPUT_TOKENS: 128,
EmbedParams.RETURN_OPTIONS: {
'input_text': True
}
}
embedding = Embeddings(
model_id=model_id,
credentials=my_credentials,
params=embed_params,
project_id=project_id,
space_id=space_id,
verify=verify
)
q = [
"A foundation model is a large-scale generative AI model that can be adapted to a wide range of downstream tasks.",
"Generative AI a class of AI algorithms that can produce various types of content including text, source code, imagery, audio, and synthetic data."
]
embedding_vectors = embedding.embed_documents(texts=q)
print(embedding_vectors)
Sustituya {region}
, {my-IBM-Cloud-API-key}
y {my-project-ID}
por valores válidos para su entorno.
Salida de ejemplo
[
[-0.0053823674,-0.018807093,0.009131943, ...-0.010469643,0.0010533642,0.020114796],
[-0.04075534,-0.041552857,0.04326911, ...0.017616473,-0.010064489,0.020788372]
]
Más información
Tema padre: BibliotecaPython
¿Fue útil el tema?
0/1000