배치에서 사용되는 영역 및 데이터 유형에 데이터 자산을 추가하고 승격하는 다양한 방법에 대해 학습합니다.
데이터는 다음과 같을 수 있습니다.
- .csv 파일 등과 같은 데이터 파일
- 데이터베이스와 같은 저장소에 있는 데이터에 대한 연결입니다.
- 스토리지 버킷에 있는 연결된 데이터입니다. 자세한 정보는 Cloud Object Storage 서비스의 데이터 사용을 참조하십시오.
참고:
- 데이터 관련 용어의 정의는 자산 유형 및 특성을 참조하십시오.
- 다음에서 카탈로그를 사용할 수 있습니다.IBM Knowledge Catalog 조직 전체에서 공유할 수 있는 데이터 자산에 액세스하기 위한 피처 스토어로 사용됩니다. 데이터 자산에는 모델에서 사용되는 위치에 대한 메타데이터가 포함됩니다. 카탈로그는 카탈로그 및 데이터 자산 레벨에서 액세스를 제어합니다.
다음 방법 중 하나를 사용하여 데이터를 영역에 추가할 수 있습니다.
- UI를 사용하여 공간에 데이터 및 연결 추가
- 연관된 프로젝트에서 파일 또는 연결과 같은 데이터 소스 승격
- 데이터 자산을 영역에 프로그래밍 방식으로 저장하십시오.
- 데이터 자산을 포함하여 공간 또는 프로젝트를 기존 공간으로 가져오십시오.
스페이스에 추가된 데이터는 프로젝트에 추가된 데이터와 비슷한 방식으로 관리됩니다. 예를 들어,
- 데이터를 영역에 추가하면 영역에 자산의 새 사본과 해당 첨부가 작성되고, 참조를 다시 프로젝트 자산으로 유지합니다. 데이터 연결과 같은 자산에 액세스 신임 정보가 필요한 경우 프로젝트 또는 영역에서 데이터에 액세스하는지 여부에 상관없이 지속되고 동일합니다.
- 프로젝트의 데이터 연결과 마찬가지로 영역에서 데이터 연결 세부사항을 편집할 수 있습니다.
- 데이터 자산은 프로젝트에 저장되는 것과 동일한 방식으로 공간에 저장됩니다. 프로젝트에 사용되는 구조와 동일한 공간 파일 구조를 사용합니다.
UI를 사용하여 공간에 데이터 및 연결 추가
UI를 사용하여 공간에 데이터 또는 연결을 추가하려면 다음을 수행하십시오.
- 배치 영역의 자산 탭에서 자산 가져오기를 클릭하십시오.
- 연결된 데이터 자산, 카탈로그 자산 또는 프로젝트 파일 중에서 선택하십시오.
- 연결된 데이터 자산을 추가하려면 연결된 데이터 를 선택하고 연결을 선택하십시오.
- 카탈로그 자산을 추가하려면 카탈로그 자산 을 선택하고 카탈로그를 선택하십시오.
- 프로젝트 파일을 추가하려면 프로젝트 파일 을 선택하고 프로젝트 파일을 선택하십시오.
- 가져오기를 클릭하십시오.
데이터 자산이 영역에 표시되고 배치 작업에서 입력 데이터 소스로 사용할 수 있게 됩니다.
프로그램으로 공간에 데이터 추가
API를 사용하여 watsonx.ai 런타임 에셋을 생성, 업데이트 또는 삭제하는 경우 데이터 및 AI 공통 코어 API를 사용해야 합니다.
프로그래밍 방식으로 자산을 추가하는 방법에 대한 예는 다음 샘플 노트북을 참조하십시오. SPSS 및 Db2 와 함께 일괄처리 배치를 사용하여 고객 이탈 예측
watsonx.ai 런타임의 데이터 소스 참조 유형
데이터 소스 참조 유형은 입력 데이터 및 결과 위치를 나타내기 위해 watsonx.ai 런타임 요청에서 참조됩니다. 다음 유형의 데이터 소스에 대해 data_asset
및 connection_asset
를 사용하십시오.
- Cloud Object Storage
- Db2
- 데이터베이스 데이터
참고:
- Decision Optimization의 경우 참조 유형은
url
입니다.
예제 data_asset 페이로드
{"input_data_references": [{
"type": "data_asset",
"connection": {
},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
}
}]
예제 connection_asset 페이로드
"input_data_references": [{
"type": "connection_asset",
"connection": {
"id": "<connection_guid>"
},
"location": {
"bucket": "<bucket_name>",
"file_name": "<directory_name>/<file_name>"
}
<other wdp-properties supported by runtimes>
}]
자세한 정보는 다음을 참조하십시오.
- watsonx.ai 런타임 REST API
Cloud Object Storage 서비스에서 데이터 사용
Cloud Object Storage 서비스는 연결된 데이터 자산이나 연결 자산을 통해 배치 작업으로 사용될 수 있습니다. Cloud Object Storage 서비스에서 데이터를 사용하려면 다음을 수행하십시오.
프로젝트 또는 스페이스에 연결을 추가하고 Cloud Object Storage (infrastructure) 또는 Cloud Object Storage 커넥터로 선택하여 IBM Cloud Object Storage 대한 연결을 만듭니다. 비밀 키, 액세스 키 및 로그인 URL을 제공하십시오.
참고:Cloud Object Storage 또는 Cloud Object Storage (인프라) 에 대한 연결을 작성할 때
access_key
및secret_key
를 둘 다 지정해야 합니다.access_key
및secret_key
가 지정되지 않은 경우 해당 연결에서 데이터를 다운로드하면 일괄처리 배치 작업에서 작동하지 않습니다. 자세한 내용은 IBM Cloud Object Storage 연결 및 IBM Cloud Object Storage (infrastructure) 연결을 참조하세요.작성한 Cloud Object Storage 연결을 사용하여 배치 영역에 입력 및 출력 파일을 연결된 데이터로 추가하십시오.
상위 주제: 배치 영역의 자산