영어 버전 문서로 돌아가기텍스트를 텍스트 임베드로 변환
텍스트를 텍스트 임베드로 변환
마지막 업데이트 날짜: 2024년 11월 28일
텍스트 임베딩 API와 사용 가능한 임베딩 모델을 사용하여 텍스트 임베딩을 생성할 수 있는 watsonx.ai 텍스트 임베딩을 사용하세요.
watsonx.ai 의 노트북에서 watsonx.ai Python 라이브러리에서 사용 가능한 함수를 사용하여 텍스트를 텍스트 임베드로 변환하십시오.
다음 코드 스니펫은 slate-30m-english-rtrvr 모델을 사용하여 다음 두 텍스트 행을 텍스트 임베드로 변환하는 방법을 보여줍니다.
- foundation model 은 광범위한 다운스트림 작업에 적용될 수 있는 대규모 생성 AI 모델입니다.
- 생성 AI는 텍스트, 소스 코드, 이미지, 오디오 및 합성 데이터를 포함하여 다양한 유형의 컨텐츠를 생성할 수 있는 AI 알고리즘 클래스입니다.
from ibm_watsonx_ai.foundation_models import Embeddings
from ibm_watsonx_ai.metanames import EmbedTextParamsMetaNames as EmbedParams
my_credentials = {
"url": "https://{region}.ml.cloud.ibm.com",
"apikey": {my-IBM-Cloud-API-key},
}
client = APIClient(my_credentials)
model_id = client.foundation_models.EmbeddingModels.SLATE_30M_ENGLISH_RTRVR
gen_parms = None
project_id = {my-project-ID}
space_id = None
verify = False
# Set the truncate_input_tokens to a value that is equal to or less than the maximum allowed tokens for the embedding model that you are using. If you don't specify this value and the input has more tokens than the model can process, an error is generated.
embed_params = {
EmbedParams.TRUNCATE_INPUT_TOKENS: 128,
EmbedParams.RETURN_OPTIONS: {
'input_text': True
}
}
embedding = Embeddings(
model_id=model_id,
credentials=my_credentials,
params=embed_params,
project_id=project_id,
space_id=space_id,
verify=verify
)
q = [
"A foundation model is a large-scale generative AI model that can be adapted to a wide range of downstream tasks.",
"Generative AI a class of AI algorithms that can produce various types of content including text, source code, imagery, audio, and synthetic data."
]
embedding_vectors = embedding.embed_documents(texts=q)
print(embedding_vectors)
{region}
, {my-IBM-Cloud-API-key}
및 {my-project-ID}
를 사용자 환경에 유효한 값으로 대체하십시오.
샘플 출력
[
[-0.0053823674,-0.018807093,0.009131943, ...-0.010469643,0.0010533642,0.020114796],
[-0.04075534,-0.041552857,0.04326911, ...0.017616473,-0.010064489,0.020788372]
]
자세히 알아보기
상위 주제: Python 라이브러리