사용자 지정 foundation model 클라우드 오브젝트 스토리지에 업로드한 후 모델과 해당 모델 자산에 대한 연결을 생성합니다. 연결을 사용하여 프로젝트 또는 스페이스에서 모델 에셋을 만들 수 있습니다.
모델 자산을 만들려면 모델에 연결을 추가한 다음 모델 자산을 만듭니다. 프로젝트에서 사용자 지정 foundation model 먼저 테스트하려면(예: Jupyter 노트북에서 평가), 사용자 지정 foundation model 에셋을 프로젝트에 추가한 다음 스페이스로 승격하세요.
모델 에셋을 추가한 후 배포하고 프롬프트 랩을 사용하여 추론할 수 있습니다.
- 원격 클라우드 스토리지에 모델을 업로드하는 경우 개인 자격 증명을 기반으로 연결을 만들어야 합니다. 원격 클라우드 저장소에는 개인 자격 증명을 사용하는 연결만 허용됩니다. 결과적으로 동일한 배포 공간의 다른 사용자는 모델 콘텐츠에 액세스할 수 없지만 모델 배포에 대한 추론을 수행할 수 있습니다. 액세스 키와 비밀 액세스 키를 사용하여 연결을 생성합니다. 계정에 개인 자격 증명을 활성화하는 방법에 대한 자세한 내용은 계정 설정를 참조하세요.
시작하기 전에
사용자 지정 foundation model 배포하려면 작업 자격 증명을 사용하도록 설정해야 합니다. 자세한 내용은 작업 자격 증명 추가하기를 참조하세요.
모델에 연결 추가하기
배포 공간 또는 프로젝트에서 모델에 연결을 추가할 수 있습니다. 프로그래밍 방식으로 연결을 추가하려면 Python 클라이언트를 사용하여 연결 만들기 또는 API를 사용하여 연결 만들기 문서를 참조하세요.
watsonx.ai API를 사용하려면 무기명 토큰이 필요합니다. 자세한 내용은 프로그래머틱 액세스를 위한 자격증명를 참조하세요.
배포 공간에서 모델에 연결 추가하기
배포 공간에서 모델에 연결을 추가하려면 다음과 같이 하세요:
- 자산 탭으로 이동하여 자산 가져오기를 클릭합니다.
- 데이터 자산를 선택한 다음 화면에 표시되는 단계를 따릅니다.
자격증명에서 Access key and Secret access key
를 선택합니다. 다른 옵션을 선택하면 배포가 작동하지 않습니다.
프로젝트에서 모델에 연결 추가하기
프로젝트에서 모델에 연결을 추가합니다:
- 자산 탭으로 이동하여 새 자산를 클릭합니다.
- 데이터 소스에 연결를 선택한 다음 화면에 표시되는 단계를 따릅니다.
자격증명에서 Access key and Secret access key
를 선택합니다. 다른 옵션을 선택하면 배포가 작동하지 않습니다.
특정 유형의 연결을 만드는 방법에 대한 자세한 내용은 커넥터를 참조하세요.
모델 에셋 만들기
사용자 지정 foundation model 에셋을 만들려면
배포 공간 또는 프로젝트에서 자산으로 이동한 다음 자산 가져오기를 클릭합니다.
사용자 지정 foundation model 선택합니다.
모델이 있는 클라우드 스토리지에 대한 연결을 선택합니다.
모델이 포함된 폴더를 선택합니다.
필수 정보를 입력하십시오. 모델 매개변수에 대한 항목을 제출하지 않으면 기본값이 사용됩니다.
가져오기를 클릭하십시오.
사용 가능한 모델 파라미터에 대한 자세한 내용은 사용자 지정 파운데이션 모델의 글로벌 파라미터를 참조하세요.
프로그래밍 방식으로 사용자 지정 foundation model 에셋 만들기
watsonx.ai API를 사용하려면 무기명 토큰이 필요합니다. 자세한 내용은 프로그래머틱 액세스를 위한 자격증명를 참조하세요.
사용 가능한 모델 파라미터에 대한 자세한 내용은 사용자 지정 파운데이션 모델의 글로벌 파라미터를 참조하세요. 모델 매개변수에 대한 항목을 제출하지 않으면 기본값이 사용됩니다.
배포 공간에 모델 에셋을 추가하는 예제 코드를 참조하세요:
curl -X POST "https://<your cloud hostname>/ml/v4/models?version=2024-01-29" \
-H "Authorization: Bearer $TOKEN" \
-H "content-type: application/json" \
--data '{
"type": "custom_foundation_model_1.0",
"framework": "custom_foundation_model",
"version": "1.0",
"name": "<asset name>",
"software_spec": {
"name": "<name of software specification>"
},
"space_id": "<your space ID>",
"foundation_model": {
"model_id": "<model ID>",
"parameters": [
{
"name": "dtype",
"default": "float16",
"type": "string",
"display_name": "Data Type",
"options": ["float16","bfloat16"]
},
{
"name": "max_batch_size",
"default": 256,
"type": "number",
"display_name": "Max Batch Size"
}],
"model_location": {
"type": "connection_asset",
"connection": {
"id": "<your connection ID>"
},
"location": {
"bucket": "<bucket where the model is located>",
"file_path": "<subpath to model files, if required>"
}
}
}
}'
프로젝트에 모델 에셋을 추가하는 예제 코드를 참조하세요:
curl -X POST "https://<your cloud hostname>/ml/v4/models?version=2024-01-29" \
-H "Authorization: Bearer $TOKEN" \
-H "content-type: application/json" \
--data '{
"type": "custom_foundation_model_1.0",
"framework": "custom_foundation_model",
"version": "1.0",
"name": "<asset name>",
"software_spec": {
"name": "<name of software specification>"
},
"project_id": "<your project ID>",
"foundation_model": {
"model_id": "<model ID>",
"parameters": [
{
"name": "dtype",
"default": "float16",
"type": "string",
"display_name": "Data Type",
"options": ["float16","bfloat16"]
},
{
"name": "max_batch_size",
"default": 256,
"type": "number",
"display_name": "Max Batch Size"
}],
"model_location": {
"type": "connection_asset",
"connection": {
"id": "<your connection ID>"
},
"location": {
"bucket": "<bucket where the model is located>",
"file_path": "<subpath to model files, if required>"
}
}
}
}'
사용자 지정 파운데이션 모델을 위한 글로벌 파라미터
전역 매개 변수를 사용하여 사용자 지정 파운데이션 모델을 배포할 수 있습니다. 다음 표에 지정된 범위 내에서 기본 모델 매개변수의 값을 설정합니다. 그렇게 하지 않으면 배포가 실패하고 추론이 불가능할 수 있습니다.
매개변수 | 유형 | 값 범위 | 기본값 | 설명 |
---|---|---|---|---|
dtype |
문자열 | float16 , bfloat16 |
float16 |
이 매개변수를 사용하여 모델의 데이터 유형을 지정할 수 있습니다. |
max_batch_size |
숫자 | max_batch_size >= 1 |
256 | 이 매개변수를 사용하여 모델의 최대 배치 크기를 지정할 수 있습니다. |
max_concurrent_requests |
숫자 | max_concurrent_requests >= 1 및 max_concurrent_requests >= max_batch_size |
1024자입니다. | 이 매개변수를 사용하여 모델에 대해 수행할 수 있는 최대 동시 요청 수를 지정할 수 있습니다. 이 매개 변수는 watsonx-cfm-caikit-1.1 소프트웨어 사양을 사용하는 배포에는 사용할 수 없습니다. |
max_new_tokens |
숫자 | max_new_tokens >= 20 |
2047 | 이 매개변수를 사용하여 추론 요청에 대해 모델이 생성하는 최대 토큰 수를 지정할 수 있습니다. |
max_sequence_length |
숫자 | max_sequence_length >= 20 및 max_sequence_length > max_new_tokens |
2048 | 이 파라미터를 사용하여 모델의 최대 시퀀스 길이를 지정할 수 있습니다. |
다음 단계
상위 주제: 사용자 지정 foundation model 배포