IBM Match 360 연결을 사용하여 엔티티, 레코드 및 관계 데이터를 데이터 자산, 카탈로그 및 DataStage 플로우에 연결하십시오.
연결된 데이터를 사용하여 IBM Match 360 with Watson 서비스로 가져오기 전에 데이터를 변환, 세분화 또는 분석하거나 세분화, 분석, 시각화 및 통제를 위해 IBM Match 360 에서 마스터 데이터를 내보낼 수 있습니다.
IBM Match 360 연결 작성에 대한 자세한 정보는 IBM Match 360 연결을 참조하십시오.
다음 비디오를 시청하여 IBM Match 360 과 연결된 데이터베이스 간에 마스터 데이터를 로드하고 내보내는 방법을 확인하십시오.
이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.
IBM Match 360 연결 사용
다음 작업공간 및 도구에서 연결된 IBM Match 360 데이터를 사용할 수 있습니다.
프로젝트
- DataStage (DataStage 서비스). DataStage의 데이터 소스에 연결을 참조하십시오.
Catalogs
- Platform assets catalog
- 기타 카탈로그 (IBM Knowledge Catalog)
통제된 카탈로그에 대해 작업 중인 경우에는 사용자가 데이터 자산 소유자인 카탈로그 자산만 보거나 추가할 수 있습니다.
예제 IBM Match 360 연결 데이터 시나리오
다음 절에서는 마스터 데이터 연결을 위한 몇 가지 공통 시나리오를 달성하는 방법에 대한 세부사항을 제공합니다.
- DataStage 및 데이터베이스 연결을 사용하여 IBM Match 360 으로 데이터 가져오기
- DataStage 및 IBM Match 360 연결을 사용하여 마스터 데이터 내보내기
- Cloud Pak for Data 자산 및 카탈로그에서 사용할 연결된 마스터 데이터 자산 내보내기
DataStage 및 데이터베이스 연결을 사용하여 IBM Match 360 으로 데이터 가져오기
이 태스크를 완료하려면 다음을 수행해야 합니다.
- 작업 소스 데이터베이스 및 해당 연결 신임 정보
- 완전히 설정된 작동 중인 IBM Match 360 서비스 인스턴스
- DataStage
DataStage 및 데이터베이스 연결을 사용하여 IBM Match 360 으로 데이터를 가져오려면 다음을 수행하십시오.
연결 자산을 작성하십시오.
- 소스 데이터베이스 연결: Cloud Pak for Data 에서 지원하는 연결을 사용하는 소스 데이터베이스에 대한 연결
- 대상 연결: IBM Match 360 연결
- 쓰기 모드: 데이터를 벌크로 로드할지 (로드) 또는 진행 중인 단위로 작은 청크로 로드할지 (진행 중인 동기화) 여부를 정의하십시오. 진행 중인 동기화 옵션은 델타 로드 시나리오에 유용합니다.
이러한 연결 작성에 대한 세부사항은 커넥터 및 하위 주제를 참조하십시오.
데이터를 IBM Match 360으로 이동하도록 DataStage 플로우를 설정하십시오. 예: [소스 데이터베이스 연결] 노드 - > COPY 스테이지 - > [IBM Match 360 연결] 노드.
세 개의 노드를 모두 함께 링크하십시오.
연결, 스키마 이름 및 테이블 이름과 같은 소스 특성을 설정하십시오.
이동할 데이터 열을 선택하십시오.
a. 소스 데이터베이스 노드의 세부사항 패널에서 편집 > 데이터 가져오기를 클릭하고 IBM Match 360으로 이동할 열을 선택하십시오. 선택적으로 열의 서브세트를 선택할 수 있습니다.
b. 모든 LONGVARCHAR 데이터 유형의 경우, VARCHAR 데이터 유형으로 변경하고 길이를 200으로 변경하십시오.
c. 적용을 클릭하십시오.
IBM Match 360 데이터 모델에 열을 맵핑하십시오.
a. COPY 스테이지를 선택하십시오.
b. 입력 탭으로 이동하여 이전 단계에서 선택한 열을 나열하는지 확인하십시오.
c. 출력 탭으로 이동한 후 편집을 클릭하십시오.
d. 현재 데이터 열 이름을 IBM Match 360 데이터 모델에 맵핑하십시오.
- 모든 출력 열을 선택하고 삭제하십시오. 데이터 가져오기를 클릭한 후 IBM Match 360 연결 내에서 해당 데이터 열을 찾으십시오.
- 가져오기 를 클릭하여 변경사항을 저장하십시오.
- 출력 탭으로 돌아가서 편집 을 다시 클릭한 후
Map from input column
열을 사용하여 IBM Match 360 열 이름을 소스 열 이름에 맵핑하십시오. - 적용 후 돌아가기를 클릭하십시오.
대상 특성을 설정하십시오.
a. IBM Match 360 연결 탭을 클릭하십시오.
b. IBM Match 360 연결을 선택한 후 데이터 카테고리, 데이터 유형 (레코드 유형) 및 엔티티 유형 (예:
record
,person
및person_record
) 을 정의하십시오. IBM Match 360 데이터 모델과 정확히 일치하는 이름을 사용하십시오.c. 저장 을 클릭하십시오.
DataStage 플로우를 저장, 컴파일 및 실행하십시오. 성공 알림이 표시되면 데이터가 IBM Match 360 으로 로드되고 이제 일치할 준비가 되었습니다.
DataStage 및 IBM Match 360 연결을 사용하여 마스터 데이터 내보내기
이 태스크를 완료하려면 다음을 수행해야 합니다.
- 작업 소스 데이터베이스 및 해당 연결 신임 정보
- 완전히 설정된 작동 중인 IBM Match 360 서비스 인스턴스
- DataStage
DataStage 및 IBM Match 360 연결을 사용하여 마스터 데이터를 내보내려면 다음을 수행하십시오.
연결 자산을 작성하십시오.
- 소스 연결: IBM Match 360 연결
- 대상 데이터베이스 연결: Cloud Pak for Data 에서 지원하는 모든 연결을 사용하는 소스 데이터베이스에 대한 연결
- 내보내기 작업 ID (선택사항): 데이터를 추출할 완료된 IBM Match 360 내보내기 작업의 작업 ID입니다. 이 필드에 값이 제공되면 다른 입력 필드는 무시되고 서비스는 제공된 내보내기 ID와 연관된 데이터를 내보냅니다.
- 필터 규칙 (선택사항): 내보내기에 포함되는 레코드 또는 엔티티 데이터를 정의하는 JSON 형식의 검색 기준입니다. 필터 규칙이 제공되지 않으면 모든 데이터를 내보냅니다. 필터 규칙은 표현식의 중첩된 조합을 포함할 수 있습니다. 각 표현식에는 특성, 조건 및 값이 포함되어 있습니다. 예를 들어, 다음 JSON 페이로드를 사용하여 개인 이메일의 값을 포함하는 레코드 또는 엔티티 데이터를 내보내는 필터를 정의하십시오. 및 법적 이름은
S
로 시작합니다. 또는 법적 성은M
로 시작합니다. 또한includeDeletes
플래그에 의해 정의된 대로 이 예제 내보내기에는 정의된 마지막 업데이트 날짜 (entity_last_updated
) 이후에 삭제된 엔티티 데이터에 대한 정보가 포함됩니다.
{ "query": { "expressions": [ { "operation": "or", "expressions": [ { "property": "legal_name.given_name", "condition": "starts_with", "value": "S" }, { "property": "legal_name.last_name", "condition": "starts_with", "value": "M" } ] }, { "property": "personal_email.email_id", "condition": "has_value", "value": null }, { "property": "entity_last_updated", "condition": "greater_than_equal", "value": "0", "expressions": [] } ], "operation": "and" }, "includeDeletes": true }
이러한 연결 작성에 대한 자세한 정보는 커넥터 및 하위 주제를 참조하십시오.
DataStage 플로우 (예: [IBM Match 360 connection] node - > [Target database connection] node) 를 설정하십시오. 가져오기 플로우와 달리 데이터 열 맵핑이 필요하지 않으므로 COPY 스테이지가 필요하지 않습니다.
소스 특성을 설정하십시오.
a. IBM Match 360 연결 노드를 선택하십시오.
b. 스테이지 탭에서 IBM Match 360 데이터 모델과 정확히 일치하는 이름을 사용하여 IBM Match 360 데이터베이스 특성을 구성하고 내보낼 데이터의 데이터 카테고리, 데이터 유형 (레코드 유형) 및 엔티티 유형 (예:
record
,person
및person_record
) 을 정의하십시오.c. 저장 을 클릭하십시오. 출력 탭에서 이동할 열을 찾아 선택하십시오. IBM Match 360 연결을 선택한 후 데이터 모델에서 필요한 데이터를 선택하십시오.
대상 특성을 설정하십시오.
a. 대상 데이터베이스 노드에서 데이터를 데이터베이스에 적용할 방법 (예: 삽입, 업데이트 또는 병합) 을 정의하십시오. 그런 다음 스키마 이름 및 테이블 이름을 정의하십시오.
b. 저장 을 클릭하십시오.
DataStage 플로우를 저장, 컴파일 및 실행하십시오. 성공 알림이 표시되면 데이터가 대상 데이터베이스에 로드됩니다.
Cloud Pak for Data 자산 및 카탈로그에서 사용할 연결된 마스터 데이터 자산 내보내기
이 태스크를 완료하려면 다음을 수행해야 합니다.
- 완전히 설정된 작동 중인 IBM Match 360 서비스 인스턴스입니다.
Cloud Pak for Data 자산 및 카탈로그에서 사용할 마스터 데이터 자산을 내보내려면 다음을 수행하십시오.
IBM Match 360 연결을 작성하십시오.
a. 프로젝트 > 자산 조치 표시줄에서 새 자산 > 데이터 소스에 연결을 클릭하십시오.
b. IBM Match 360 연결을 선택하십시오.
c. 이름에 이 연결에 대한 설명을 제공한 후 연결하려는 IBM Match 360 서비스 인스턴스의 나머지 연결 세부사항을 제공하십시오. 연결 작성에 대한 자세한 정보는 IBM Match 360 연결을 참조하십시오.
IBM Match 360 연결 데이터 자산을 작성하십시오.
a. 프로젝트 > 자산 조치 표시줄에서 자산 가져오기 > 연결된 데이터를 클릭하십시오.
c. 소스 선택을 클릭한 후 사용 가능한 데이터베이스에서 연결 소스를 선택하십시오.
d. IBM Match 360 연결을 선택한 후 이 연결된 데이터 자산에 포함할 데이터 모델에서 데이터를 선택하십시오.
e. 연결된 데이터 자산의 이름 및 설명을 제공한 후 작성을 클릭하십시오. 이제 프로젝트의 자산 탭에서 연결된 새 데이터 자산을 볼 수 있습니다.
카탈로그에 데이터 자산을 공개하십시오.
a. 프로젝트의 자산 탭에서 데이터 자산을 찾은 후 자산의 오버플로우 메뉴에서 카탈로그에 공개 를 선택하십시오.
b. 공개할 카탈로그를 선택하고 작업에 설명을 제공한 후 중복 조치 동작 및 개인정보 보호정책을 구성하십시오.
c. 선택적으로, 데이터를 구성하고 찾는 데 도움이 되는 태그를 추가한 후 공개를 클릭하십시오. 이제 카탈로그에서 데이터를 사용할 수 있습니다. 카탈로그 자산 작업에 대한 자세한 정보는 카탈로그 asssets를 참조하십시오.
자세한 정보
상위 주제: 마스터 데이터 구성하기