자산 유형 및 특성
Cloud Pak for Data 및 해당 서비스는 협업 작업 공간 및 도구를 제공하는 플랫폼을 제공합니다. 컨텐츠를 자산 양식으로 플랫폼에 제공합니다. 자산 은 데이터, 기타 가치있는 정보 또는 데이터에 대해 작동하는 코드에 대한 정보를 포함하는 항목입니다.
자산을 가져오거나 도구로 자산을 작성하여 자산을 추가합니다. 협업 작업 영역에서 자산에 대해 작업합니다. 사용하는 작업공간은 태스크에 따라 다릅니다.
프로젝트 다른 사용자와 협업하여 데이터 작업을 수행하고 자산을 작성합니다. 대부분의 도구는 프로젝트에 있으며 프로젝트의 코드를 포함하는 자산을 실행합니다. 예를 들어, 데이터를 가져오고 데이터를 준비하고 데이터를 분석하거나 프로젝트에서 모델을 작성할 수 있습니다. 프로젝트를 참조하십시오.
카탈로그 조직과 공유할 자산을 저장하거나 작업해야 하는 자산을 찾습니다. 카탈로그에서 프로젝트로 자산을 복사하거나 프로젝트에서 카탈로그로 자산을 공개할 수 있습니다. 카탈로그에서 자산 특성 및 메타데이터를 편집할 수 있지만 자산을 실행할 수는 없습니다. 카탈로그를 참조하십시오.
배치 공간 테스트 또는 프로덕션을 위해 준비된 자산을 배치하고 실행하는 곳입니다. 프로젝트에서 배치 공간으로 자산을 이동한 후 해당 자산에서 배치를 작성합니다. 필요에 따라 배치를 모니터하고 업데이트합니다. 배치 영역을 참조하십시오.
다음 그래픽은 플랫폼에서 자산을 이동하는 방법을 보여줍니다.
글로벌 검색 표시줄에서 검색하여 사용자가 협업자인 작업공간에서 자산을 찾을 수 있습니다. 플랫폼 전체에서 자산 검색을 참조하십시오.
여러 가지 유형의 자산을 작성할 수 있지만 모든 자산에는 몇 가지 공통 특성이 있습니다.
자산 유형
대부분의 자산 유형을 작성하려면 특정 도구를 사용해야 합니다. 대부분의 도구는 하나 이상의 서비스에 의해 제공됩니다. 데이터 자산 및 연결 자산을 작성하는 도구는 플랫폼에서 제공하며 특정 서비스가 필요하지 않습니다.
도구에 필요한 서비스를 확인하려면 도구 및 서비스 맵을 여십시오.
다음 표에는 작성할 수 있는 자산 유형, 작성해야 하는 도구 및 추가할 수 있는 작업공간이 나열되어 있습니다.
자산 유형 | 설명 | 이를 작성하기 위한 도구 | 작업공간 |
---|---|---|---|
AutoAI 실험 | 후보 예측 모델 파이프라인을 자동으로 생성합니다. | AutoAI | 프로젝트 |
COBOL 카피북 | z/OS 메인프레임 컴퓨터에서 연결된 데이터 자산의 맵 메타데이터를 표시합니다. | Metadata import 도구 | 프로젝트, 카탈로그 |
연결된 데이터 자산(connected data asset) | 원격 데이터 소스에 대한 연결을 통해 액세스되는 데이터를 나타냅니다. | 연결된 데이터 도구, Metadata import 도구 | 프로젝트, 카탈로그, 공간 |
연결 | 데이터 소스에 연결하기 위한 정보를 포함합니다. | 연결 도구 | 프로젝트, 카탈로그, 공간 |
대시보드 | 코드 없이 대화식 그래프로 데이터를 시각화합니다. | 대시보드 편집기 | 프로젝트, 카탈로그 |
파일의 데이터 자산 | 로컬 시스템에서 업로드한 파일을 나타냅니다. | 업로드 분할창 | 프로젝트, 카탈로그, 공간 |
Data Refinery 플로우 | 데이터를 준비합니다. | Data Refinery | 프로젝트, 공간 |
Data Replication 플로우 | 데이터를 복제합니다. | Data Replication | 프로젝트, 카탈로그 |
데이터 품질 정의 | 데이터 품질 규칙에 대한 재사용 가능한 규칙 로직 컴포넌트를 정의합니다. | 데이터 품질 정의 편집기 | 프로젝트, 카탈로그 |
데이터 품질 규칙 | 특정 조건에 대한 데이터 품질을 평가합니다. | 데이터 품질 규칙 편집기 | 프로젝트 |
DataStage 데이터 정의 | DataStage 플로우 작업에 재사용 가능한 열 메타데이터 구성요소를 정의합니다. | DataStage 기 | 프로젝트, 공간 |
DataStage 플로우 | 데이터를 변환하고 통합합니다. | DataStage 플로우 편집기 | 프로젝트, 공간 |
DataStage 스키마 라이브러리 | DataStage 재사용 가능한 자원 세트를 가져옵니다. | DataStage 기 | 프로젝트, 공간 |
DataStage 표준화 규칙 | DataStage 데이터를 형식화하기 위해 재사용 가능한 규칙 컴포넌트를 정의합니다. | DataStage 기 | 프로젝트, 공간 |
DataStage 서브플로우 | DataStage 대해 재사용 가능한 스테이지 및 커넥터 세트를 정의합니다. | DataStage 기 | 프로젝트, 공간 |
Decision Optimization 실험(Decision Optimization experiment) | 최적화 문제를 해결한다. | Decision Optimization | 프로젝트 |
연합 학습 실험 | 원격 데이터 소스 세트에서 공통 모델을 순회합니다. | 연합 학습 | 프로젝트 |
폴더 자산 | IBM Cloud Object Storage에 폴더를 표시합니다. | 연결된 데이터 도구 | 프로젝트, 카탈로그, 공간 |
Jupyter 노트북 | Python 또는 R 코드를 실행하여 데이터 또는 빌드 모델을 분석합니다. | Jupyter 노트북 편집기 | 프로젝트, 카탈로그 |
마스킹 플로우 | 데이터 자산의 마스크된 사본을 작성합니다. | 마스킹 플로우 | 프로젝트 |
마스터 데이터 구성 | Match 360을 구성합니다. | Match 360 | 프로젝트 |
메타데이터 인리치먼트 | 가져온 자산 메타데이터를 보강합니다. | 메타데이터 강화 도구 | 프로젝트 |
Metadata import | 연결에서 자산 메타데이터를 가져옵니다. | Metadata import 도구 | 프로젝트 |
모델 | 저장되거나 가져온 모델에 대한 정보를 포함합니다. | 실험 또는 훈련 모델을 실행하는 다양한 도구 | 프로젝트, 카탈로그, 공간 |
모델 유스 케이스 | 요청에서 프로덕션으로 모델의 수명 주기를 추적합니다. | AI Factsheets | 카탈로그 |
매개변수 세트 | DataStage 대해 재사용 가능한 작업 매개변수 세트를 수집합니다. | 매개변수 세트 편집기 | 프로젝트 |
파이프라인 | 모델 수명 주기를 자동화합니다. | Watson Pipelines | 프로젝트 |
Python 함수 | 프로덕션에서 모델을 지원하기 위한 Python 코드를 포함합니다. | Jupyter 노트북 편집기 | 프로젝트, 공간 |
스크립트 | 프로덕션에서 모델을 지원하는 Python 또는 R 스크립트를 포함합니다. | Jupyter 노트북 편집기, RStudio | 프로젝트, 공간 |
SPSS Modeler 플로우 | 플로우를 실행하여 데이터를 준비하고 모델을 빌드합니다. | SPSS Modeler | 프로젝트 |
시각화 | 데이터 자산의 시각화를 표시합니다. | 데이터 자산의 시각화 페이지 | 프로젝트 |
자산에 대한 공통 특성
자산은 자산을 작성하거나 사용하거나 자동화된 프로세스에 의해 업데이트될 때 특성에 정보가 누적됩니다. 일부 특성은 사용자가 제공하며 사용자가 편집할 수 있습니다. 기타 특성은 시스템에서 자동으로 제공됩니다. 대부분의 시스템 제공 특성은 사용자가 편집할 수 없습니다.
모든 위치에서 자산에 대한 공통 특성
대부분의 자산 유형에는 해당 자산 유형이 존재하는 모든 작업공간의 다음 테이블에 나열된 특성이 있습니다.
특성 | 설명 | 편집 가능한가요? |
---|---|---|
이름 | 자산 이름. 최대 100자를 포함할 수 있습니다. 멀티바이트 문자를 지원합니다. 비어 있을 수 없으며, 유니코드 제어 문자를 포함할 수 없고, 공백만 포함할 수 없습니다. 자산 이름은 프로젝트 또는 배치 공간에서 고유하지 않아도 됩니다. 카탈로그에서 자산 이름이 고유해야 하는지 여부는 카탈로그의 중복 처리 방법 세트에 따라 다릅니다. | 예 |
설명 | 선택사항. 공백을 제외하고 최대 245자를 포함할 수 있습니다. 멀티바이트 문자 및 하이퍼링크를 지원합니다. | 예 |
작성 날짜 | 자산을 작성하거나 가져올 때의 시간소인입니다. | 아니오 |
작성자 또는 소유자 | 자산을 작성하거나 가져온 사용자의 사용자 이름 또는 이메일 주소입니다. | 아니오 |
마지막 수정 날짜 | 자산이 마지막으로 수정된 시기의 시간소인입니다. | 아니오 |
마지막 편집자 | 마지막으로 자산을 수정한 사용자의 사용자 이름 또는 이메일 주소입니다. | 아니오 |
카탈로그에 있는 자산의 공통 특성
모든 자산이 보유하는 공통 특성 외에도 카탈로그의 자산에는 다음 표에 나열된 특성 및 페이지가 있습니다.
특성 또는 페이지 | 설명 | 편집 가능한가요? |
---|---|---|
자산 페이지 | 자산의 컨텐츠에 대한 보기입니다. 자산 컨텐츠 또는 미리보기를 참조하십시오. | 아니오 |
개인정보 보호 | 기본적으로 공용으로 설정됩니다. 이 설정은 개인용으로 설정된 경우 카탈로그의 자산에 대한 액세스를 제한할 수 있습니다. 자산의 소유자 및 구성원만 개인용 자산을 보고 사용할 수 있습니다. | 예 |
액세스 페이지 | 자산의 소유자 및 구성원입니다. 기본적으로 자산 소유자는 자산을 카탈로그에 추가한 사용자입니다. 자산 구성원은 개인용으로 표시될 때 자산을 보고 사용할 수 있습니다. 자산에 대한 액세스 제어를 참조하십시오. | 예 |
등급 페이지 | 선택사항. 카탈로그 협업자는 자산을 평가하고 검토할 수 있습니다. | 예 |
태그 | 선택사항. 협업자가 검색을 단순화하기 위해 작성하는 텍스트 레이블입니다. 태그는 최대 255자의 한 문자열로 구성됩니다. 공백, 문자, 숫자, 밑줄, 대시 및 기호 #과 @를 포함할 수 있습니다. | 예 |
관계 | 선택사항. 자산 개요 페이지의 관련 항목 섹션에 표시되는 관계는 정보용이며 자산에 다른 영향을 미치지 않습니다. 동일한 작업공간 또는 다른 작업공간에 있는 자산 사이에 있을 수 있습니다. 예를 들어, 카탈로그의 자산과 프로젝트의 자산 사이에 관계를 추가할 수 있습니다. 자산과 아티팩트 사이에 있을 수 있습니다. 예를 들어, 자산과 정책 간의 관계를 추가할 수 있습니다. 관리자는 자산에 대한 사용자 정의 관계를 작성할 수 있습니다. 자산 관계 추가를 참조하십시오. | 예 |
통제 아티팩트 | 선택사항. 사용자가 자산에 지정한 비즈니스 용어 및 분류입니다. 이러한 지정은 자산에 영향을 줄 수 있습니다. 예를 들어, 지정된 비즈니스 용어는 데이터 보호 규칙의 적용을 트리거할 수 있습니다. | 예 |
자산 유형에 대한 사용자 정의 특성을 작성할 수 있습니다. 사용자 정의 특성은 카탈로그의 자산의 개요 탭에 있는 세부사항 섹션에 표시됩니다. 사용자 정의 특성 및 관계를 참조하십시오.
자산 특성을 편집하려면 필수 권한이 있어야 합니다. 카탈로그에서 자산 편집을 참조하십시오.
도구에서 실행되는 자산의 공통 특성
일부 자산은 도구 실행과 연관되어 있습니다. 예를 들어, AutoAI 실험 자산은 AutoAI 도구에서 실행됩니다. 도구에서 실행되는 자산은 운영 자산으로도 알려져 있습니다. 도구에서 자산을 실행할 때마다 작업을 시작합니다. 작업을 모니터하고 스케줄링할 수 있습니다. 작업은 계산 자원을 사용합니다. 컴퓨팅 리소스는 용량 단위 시간(CUH)으로 측정되며 추적됩니다. 서비스 계획에 따라 매월 제한된 양의 CUH를 사용하거나 매월 사용하는 CUH를 지불할 수 있습니다.
도구에서 실행되는 많은 자산의 경우, 사용할 계산 환경 구성을 선택할 수 있습니다. 일반적으로 더 크고 빠른 환경 구성이 컴퓨팅 리소스를 더 빠르게 사용합니다.
기본 특성 외에 도구에서 실행되는 대부분의 자산에는 프로젝트에 다음과 같은 유형의 정보가 포함됩니다.
특성 | 설명 | 편집 가능한가요? | 작업공간 |
---|---|---|---|
환경 정의 | 자산 실행을 위한 환경 템플리트, 하드웨어 스펙 및 소프트웨어 스펙입니다. 환경을 참조하십시오. | 예 | 프로젝트, 공간 |
설정 | 자산이 실행되는 방법을 정의하는 정보입니다. 자산의 각 유형에 특정합니다. | 예 | 프로젝트 |
연관된 데이터 자산 | 자산이 작업 중인 데이터입니다. | 예 | 프로젝트 |
작업 | 환경 정의, 스케줄 및 알림 옵션을 포함하여 자산을 실행하는 방법에 대한 정보입니다. 작업을 참조하십시오. | 예 | 프로젝트, 공간 |
데이터 자산 유형 및 해당 특성
데이터 자산 유형에는 데이터에 액세스하는 방법을 포함하여 데이터에 대한 메타데이터 및 기타 정보가 포함됩니다.
데이터 자산을 작성하는 방법은 데이터가 있는 위치에 따라 다릅니다.
- 데이터가 파일에 있는 경우 로컬 시스템에서 프로젝트, 카탈로그 또는 배치 영역으로 파일을 업로드합니다.
- 데이터가 원격 데이터 소스에 있는 경우 먼저 해당 데이터 소스에 대한 연결을 정의하는 연결 자산을 작성합니다. 그런 다음, 연결, 경로 또는 기타 구조, 데이터를 포함하는 테이블 또는 파일을 선택하여 데이터 자산을 작성합니다. 이 유형의 데이터 자산을 연결된 데이터 자산이라고 합니다.
다음 그래픽은 파일의 데이터 자산이 Cloud Object Storage의 업로드된 파일을 가리키는 방법을 보여줍니다. 연결된 데이터 자산에는 연결 자산이 필요하며 원격 데이터 소스의 데이터를 가리킵니다.
다음 유형의 데이터 자산을 작성할 수 있습니다.
파일의 데이터 자산 로컬 시스템에서 업로드한 파일을 나타냅니다. 파일은 프로젝트, 카탈로그 또는 배치 영역과 연관된 IBM Cloud Object Storage 인스턴스의 오브젝트 스토리지 컨테이너에 저장됩니다. 파일의 컨텐츠에는 구조화된 데이터, 구조화되지 않은 텍스트 데이터, 이미지 및 기타 유형의 데이터가 포함될 수 있습니다. 임의 형식의 파일로 데이터 자산을 작성할 수 있습니다. 그러나 다른 파일 형식에 비해 CSV 파일에 대해 더 많은 조치를 수행할 수 있습니다. 데이터 자산의 특성을 참조하십시오. 프로젝트, 카탈로그 또는 배치 공간에 파일을 업로드하여 파일에서 데이터 자산을 작성할 수 있습니다. 또한 도구를 사용하여 데이터 파일을 작성하고 이를 자산으로 변환할 수 있습니다. 예를 들어, Data Refinery, Jupyter 노트북 및 RStudio 도구를 사용하여 파일에서 데이터 자산을 작성할 수 있습니다.
연결된 데이터 자산 원격 데이터 소스에 대한 연결을 통해 액세스되는 테이블, 파일 또는 폴더를 나타냅니다. 연결은 연결된 데이터 자산과 연관된 연결 자산에서 정의됩니다. 지원되는 모든 연결에 대해 연결된 데이터 자산을 작성할 수 있습니다. 연결된 데이터 소스에 액세스할 때 데이터는 데이터 소스에서 동적으로 검색됩니다. 데이터 자산의 특성을 참조하십시오. 프로젝트, 카탈로그 또는 배치 공간에서 연결된 데이터 도구를 사용하여 데이터 소스에서 연결된 데이터 자산을 가져올 수 있습니다. 스케줄에서 가져오기를 다시 실행하려면 프로젝트에서 메타데이터 가져오기 도구를 사용하십시오. Data virtualization 작업공간에서 Watson Query 를 사용하여 여러 데이터 소스에서 데이터를 컴파일하는 가상 테이블을 작성할 수 있습니다.
폴더 자산 IBM Cloud Object Storage의 폴더를 표시합니다. 폴더 데이터 자산은 연결된 데이터 자산의 특수한 경우입니다. 폴더 및 IBM Cloud Object Storage 연결 자산에 대한 경로를 지정하여 폴더 데이터 자산을 작성합니다. 폴더 데이터 자산과 경로를 공유하는 파일 및 하위 폴더를 볼 수 있습니다. 폴더 데이터 자산 내에서 볼 수 있는 파일 자체는 데이터 자산이 아닙니다. 예를 들어, 지속적으로 업데이트되는 뉴스 피드가 포함된 경로의 폴더 데이터 자산을 작성할 수 있습니다. 데이터 자산의 특성을 참조하십시오. 프로젝트, 카탈로그 또는 배치 공간에서 연결된 데이터 도구를 사용하여 IBM Cloud Object Storage 에서 폴더 자산을 가져올 수 있습니다.
연결 자산 데이터 소스에 대한 연결을 작성하는 데 필요한 정보를 포함합니다. 연결 자산의 특성을 참조하십시오. 프로젝트, 카탈로그 또는 배치 공간에서 연결 도구를 사용하여 연결을 작성할 수 있습니다.
데이터 자산 작성 및 가져오기에 대한 자세한 정보는 다음을 참조하십시오.
파일 및 연결된 데이터 자산의 데이터 자산 특성
기본 특성 및 공통 카탈로그 특성 외에, 파일 및 연결된 데이터 자산의 데이터 자산에는 다음 표에 나열된 특성 또는 페이지가 있습니다.
특성 또는 페이지 | 설명 | 편집 가능한가요? | 작업공간 |
---|---|---|---|
컬럼 | 데이터 자산의 컬럼 특성에 대한 요약입니다. 각 열에 대한 품질 점수, 설명, 지정된 데이터 클래스 및 지정된 비즈니스 용어를 포함합니다. 지정된 데이터 클래스 및 비즈니스 용어가 자산에 영향을 줄 수 있습니다. 예를 들어, 지정된 비즈니스 용어는 데이터 보호 규칙의 적용을 트리거할 수 있습니다. | 아니오 | 카탈로그 |
태그 | 선택사항. 사용자가 검색을 단순화하기 위해 작성하는 텍스트 레이블입니다. 태그는 최대 255자의 한 문자열로 구성됩니다. 공백, 문자, 숫자, 밑줄, 대시 및 기호 #과 @를 포함할 수 있습니다. | 예 | 프로젝트, 카탈로그 |
형식 | MIME 유형의 파일입니다. 자동으로 감지됩니다. | 예 | 프로젝트, 카탈로그, 공간 |
소스 | 스토리지 또는 데이터 소스 및 연결에 있는 데이터 파일에 대한 정보입니다. | 아니오 | 프로젝트, 카탈로그, 공간 |
자산 세부사항 | 데이터 크기, 컬럼 및 행 수 및 자산 버전에 대한 정보입니다. | 아니오 | 프로젝트, 카탈로그, 공간 |
자산 미리보기 또는 자산 페이지 | 원래 데이터 소스의 제한된 컬럼 및 행 세트를 포함하는 데이터의 미리보기입니다. 자산 컨텐츠 또는 미리보기를 참조하십시오. | 아니오 | 프로젝트, 카탈로그, 공간 |
프로파일 페이지 | 데이터의 컨텐츠에 대한 메타데이터 및 통계입니다. 프로파일을 참조하십시오. | 예 | 프로젝트, 카탈로그 |
Activities 분할창 | 모든 작업공간에서 자산에 대해 수행된 조치의 히스토리입니다. 활동을 참조하십시오. | 아니오 | 카탈로그 |
시각화 페이지 | 사용자가 데이터를 이해하기 위해 작성하는 차트 및 그래프입니다. 시각화를 참조하십시오. | 예 | 프로젝트 |
기능 그룹 페이지 | 모델에서 기능으로 사용되는 데이터 자산의 컬럼에 대한 정보입니다. 기능 그룹 관리를 참조하십시오. | 예 | 프로젝트, 카탈로그, 공간 |
연결 자산의 특성
연결 자산의 특성은 연결 작성 시 선택하는 데이터 소스에 따라 다릅니다. 연결 유형을 참조하십시오. 대부분의 데이터 소스에 대한 연결 자산에는 다음 표에 나열된 특성이 있습니다.
특성 | 설명 | 편집 가능한가요? | 작업공간 |
---|---|---|---|
연결 세부사항 | 데이터 소스를 식별하는 정보입니다. 예를 들어, 데이터베이스 이름, 호스트 이름, IP 주소, 포트, 인스턴스 ID, 버켓, 엔드포인트 URL등이 있다. | 예 | 프로젝트, 카탈로그, 공간 |
인증 정보 설정 | 신임 정보가 플랫폼에서 공유되는지 (기본값) 또는 각 사용자가 개인 신임 정보를 입력해야 합니다. 모든 데이터 소스가 개인 신임 정보를 지원하지는 않습니다. | 예 | 프로젝트, 카탈로그, 공간 |
인증 메소드 | 신임 정보의 형식입니다. 예를 들어, API키 또는 사용자 이름과 비밀번호가 있다. | 예 | 프로젝트, 카탈로그, 공간 |
신임 정보 | 데이터 소스 및 지정된 인증 메소드에 필요한 사용자 이름 및 비밀번호, API키 또는 기타 신임 정보. | 예 | 프로젝트, 카탈로그, 공간 |
인증서 | 데이터 소스 포트가 SSL 연결 및 SSL 인증서에 대한 다른 정보를 수용하도록 구성되어 있는지의 여부. | 예 | 프로젝트, 카탈로그, 공간 |
개인용 연결 | 인터넷으로 구체화되지 않은 데이터베이스에 연결하는 메소드입니다. 연결 보안을 참조하십시오. | 예 | 프로젝트, 카탈로그, 공간 |
위치 및 주권 | 데이터가 저장된 데이터 센터의 실제 위치와 데이터를 관할하는 국가 엔티티입니다. | 예 | 프로젝트, 카탈로그, 공간 |