데이터 추가 및 데이터 모델에 맵핑(IBM Match 360)

영어 버전 문서로 돌아가기

마지막 업데이트 날짜: 2024년 11월 22일

데이터 추가 및 데이터 모델에 맵핑(IBM Match 360)

각 데이터 소스 또는 자산을 데이터 모델에 맵핑하고 공개해야 IBM Match 360 기능 (예: 일치) 에서 사용할 수 있습니다.

필수 권한: 데이터 자산을 마스터 데이터 인스턴스에 추가, 맵핑 및 공개하려면 IBM Match 360 서비스에 대한 DataEngineer 사용자 그룹의 구성원이어야 합니다.; 통제된 카탈로그에 대해 작업 중인 경우에는 데이터 자산 소유자인 카탈로그 자산만 보거나 추가할 수 있습니다.

IBM Match 360은 데이터 엔지니어가 데이터의 각 열을 모델에 수동으로 맵핑할 필요성을 제거하는 강력한 자동 맵핑 기능을 포함하고 있습니다. 자동 맵핑 기능은 데이터의 각 열을 발견 및 분석하고 데이터 모델의 대응하는 속성이나 필드로 분류합니다. 자동 맵핑을 실행할 수 있으려면 먼저 데이터를 프로파일링해야 합니다. 프로파일링은 데이터를 분석하고 분류하여 자동 맵핑 프로세스가 발생할 수 있게 합니다.

프로파일링 및 자동화는 개인 및 조직 레코드 유형에 대해서만 지원됩니다. 다른 유형의 레코드의 경우 열을 데이터 모델에 수동으로 맵핑하십시오.

이 주제의 내용:

플랫 데이터 파일에서 레코드 데이터 추가
프로젝트를 통해 데이터 또는 소스 추가
데이터 모델에 데이터 맵핑
데이터 자산에 맵핑 패턴 적용
플랫 데이터 파일에서 관계 데이터 추가
샘플 데이터 공개

플랫 데이터 파일에서 레코드 데이터 추가

CSV 또는 TSV 파일에서 IBM Match 360에 레코드 데이터를 추가하려면 다음을 수행하십시오.

마스터 데이터 탐색 메뉴에서 자산 아이콘 ' '을 클릭합니다.
작업 표시줄에서 데이터 추가 또는 프로젝트에 에셋 업로드 아이콘 ' '을 클릭합니다.
열리는 데이터 패널에서, 프로젝트 또는 카탈로그로부터 업로드에 의해 데이터를 추가할지 여부를 선택하십시오. 데이터 파일을 업로드하려면 로드를 선택하십시오.
로컬 컴퓨터에서, CSV 또는 TSV 형식의 일반 데이터 파일을 선택하고 데이터 패널로 끌고 가십시오. 파일이 업로드를 완료할 때 자산 요약 목록에 추가됩니다.
자산 탭에서 자산 요약 표를 사용하여 새로 추가된 자산과 시스템의 다른 데이터 자산에 대한 세부 정보를 검토합니다.

자산에 자산 콘텐츠 열에 정보가 없는 경우 특정 레코드 유형과 같이 자산에 포함된 데이터 유형을 정의해야 합니다. 각 자산에 올바른 콘텐츠 유형을 할당하여 IBM Match 360이 데이터 모델에서 데이터에 가장 잘 맞는 부분을 찾을 수 있도록 하는 것이 중요합니다. 에셋 콘텐츠 유형이 정의되지 않은 에셋은 에셋 데이터 유형 누락 상태입니다. 콘텐츠 유형을 먼저 정의하지 않으면 에셋을 매핑할 수 없습니다.

자산의 콘텐츠 유형을 정의하려면 레코드의 자산 콘텐츠 열에 있는 드롭다운 목록에서 해당 유형을 선택합니다. 에셋의 상태가 매핑 준비로 변경됩니다.

적절한 데이터 유형이 자산 콘텐츠 목록에 없는 경우 데이터 모델을 사용자 지정해야 할 수 있습니다. 자세한 정보는 데이터 모델 사용자 정의를 참조하십시오.

다음 단계: 데이터 모델에 데이터 맵핑

프로젝트를 통해 데이터 또는 소스 추가

프로젝트를 통해 IBM Match 360 에 데이터 자산, 소스 또는 연결을 추가할 수 있습니다.

IBM Match 360 을 연결된 데이터 소스 또는 대상으로 사용할 수 있습니다. IBM Match 360 연결 설정 및 사용에 대한 정보는 IBM Match 360 연결을 참조하십시오.

IBM Match 360 으로 로드하려는 데이터 자산 파일에는 지원되는 유형의 파일 확장자 (예: .csv 또는 .tsv) 가 포함되어야 합니다. 이 요구사항에는 프로젝트에 이미 있는 자산이 포함됩니다. 프로젝트의 자산 이름에 지원되는 파일 확장자가 포함되지 않은 경우 추가하려고 할 때 회색으로 표시됩니다. 프로젝트에서 자산의 이름을 편집하려면 프로젝트의 자산 탭으로 이동하여 자산을 선택한 후 이 자산 정보 패널에서 이름을 편집하십시오.

연결을 작성하고 프로젝트에 연결된 데이터를 추가하는 방법을 보려면 이 동영상을 시청하십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

자막

비디오와 자막 동기화

동영상 대본
시간	대본
00:00	이 동영상에서는 데이터 소스에 대한 연결을 설정하고 연결된 데이터를 프로젝트에 추가하는 방법을 보여 줍니다.
00:08	데이터 소스에 저장된 데이터가 있는 경우 프로젝트에서 해당 데이터 소스에 대한 연결을 설정할 수 있습니다.
00:16	여기에서 프로젝트에 다른 요소를 추가할 수 있습니다.
00:20	이 경우 연결을 추가하려고 합니다.
00:24	IBM 서비스 (예: IBM Db2 및 Cloud Object Storage) 또는 써드파티 (예: Amazon, Microsoft 또는 Apache) 의 서비스에 대한 새 연결을 작성할 수 있습니다.
00:39	호환 가능한 서비스를 기반으로 목록을 필터링할 수 있습니다.
00:45	또한 플랫폼 레벨에서 작성된 연결을 추가할 수 있으며, 이는 프로젝트 및 카탈로그에서 사용할 수 있습니다.
00:54	또는 프로비저닝된 IBM Cloud 서비스 중 하나에 대한 연결을 작성할 수 있습니다.
00:59	이 경우 Db2 Warehouse on Cloud에 대해 프로비저닝된 IBM Cloud 서비스를 선택하십시오.
01:08	신임 정보가 미리 채워지지 않은 경우, IBM Cloud 서비스 실행 페이지에서 인스턴스의 신임 정보를 가져올 수 있습니다.
01:17	먼저 연결을 테스트한 후 연결을 작성하십시오.
01:25	이제 새 연결이 데이터 자산 목록에 표시됩니다.
01:30	다음으로 이 프로젝트에 연결된 데이터 자산을 추가하십시오.
01:37	소스를 선택하십시오. 이 경우에는 방금 작성된 Db2 Warehouse on Cloud 연결입니다.
01:43	그런 다음 스키마 및 테이블을 선택하십시오.
01:50	이 연결 내의 데이터에 대한 참조를 추가하여 대상 프로젝트에 포함하는 것을 볼 수 있습니다.
01:58	이름 및 설명을 제공하고 "작성"을 클릭하십시오.
02:06	이제 데이터가 데이터 자산 목록에 표시됩니다.
02:09	데이터 세트를 열어 미리보기를 가져오고 여기에서 직접 이름합로 데이터를 세분화할 수 있습니다.
02:17	Cloud Pak for Data as a Service 문서에서 더 많은 동영상을 보십시오.

프로젝트에 직접 데이터를 추가하는 방법에 대한 자세한 정보는 프로젝트에 데이터 추가를 참조하십시오.

데이터를 추가한 후에는 IBM Match 360 데이터 모델에 맵핑해야 합니다. 자세한 내용은 데이터 모델에 데이터 맵핑을 참조하십시오.

데이터 모델에 데이터 맵핑

IBM Match 360에서 사용할 데이터 자산을 공개하려면 먼저 맵핑해야 합니다. 자산의 각 열은 해당 데이터 모델 속성에 매핑되거나 제외되어야 합니다.

데이터 자산을 맵핑하기 위한 몇 가지 옵션이 있습니다.

각 열을 수동으로 맵핑할 수 있습니다.
프로파일링 및 자동 매핑을 사용하여 각 열을 매핑할 수 있습니다.
맵핑 패턴을 적용할 수 있습니다.

기억하세요: IBM Match 360의 프로파일링 및 자동 매핑 기능을 사용하려면, IBM Cloud Pak for Data 배포에 반드시 IBM Knowledge Catalog가 포함되어 있어야 합니다.

수동 매핑 또는 자동 매핑 사용에 대한 자세한 내용은 다음 절차를 참조하세요. 맵핑 패턴 적용에 대한 세부사항은 데이터 자산에 맵핑 패턴 적용을 참조하십시오.

데이터 자산을 IBM Match 360 데이터 모델에 맵핑하려면 다음을 수행하십시오.

자산 요약 화면에서 매핑 탭을 클릭합니다.
자산 목록에서 시스템에 맵핑할 데이터 자산을 클릭하십시오.

원하는 자산을 쉽게 찾을 수 있도록 자산 이름으로 검색하거나 열 수, 레코드 유형, 매핑 상태, 게시 상태 또는 사용 가능한 매핑 패턴을 기준으로 필터링할 수 있습니다. 필터 아이콘 ' '을 클릭하여 필터를 적용합니다.

선택한 자산의 데이터는 여러 행 및 열이 있는 테이블 형식으로 표시됩니다. 각 열은 데이터 모델의 대응하는 속성 유형에 맵핑되어야 하는 속성을 나타냅니다. 데이터 소스 또는 자산을 처음 열면 각 열에 맵핑되지 않음 태그가 표시됩니다.

팁: 선택하는 경우 각 열을 수동으로 맵핑할 수 있지만, 자동 맵핑 기능을 활용하여 맵핑 프로세스의 속도를 크게 높일 수 있습니다.
매핑 세부 정보 패널에서 이 에셋의 매핑 통계를 검토합니다. 이 에셋에서 매핑된 데이터 열이 몇 개 있는지 한 눈에 확인할 수 있습니다(있는 경우).
이 소스나 자산에 대해 자동 맵핑을 사용 가능하게 하려면 먼저 데이터를 프로파일링해야 합니다. 프로필 데이터를 클릭합니다.

프로파일링은 데이터를 분석하고 분류하여 자동 맵핑 프로세스가 발생할 수 있게 합니다. 프로파일링은 완료하는 데 다소 시간이 걸릴 수 있으므로, 계속 작업할 수 있도록 백그라운드에서 실행됩니다. 검토 및 수동으로 일부 열 맵핑을 시작하기 원할 수 있습니다.

자동 맵핑은 사용자가 수행한 수동 맵핑을 겹쳐쓰지 않습니다.
프로파일링이 완료되면 자동 매핑 에셋를 클릭합니다. IBM Match 360 with Watson이 데이터를 분석하고 자동으로 가능한 많은 열을 데이터 모델에 맵핑합니다. 특정 열을 맵핑할 수 없는 경우에도 자동 맵핑 기능은 가능성이 가장 큰 맵핑 선택사항을 몇 가지 제안할 수 있습니다.
자동 맵핑 결과를 검토하십시오. 맵핑 중 하나가 올바르지 않은 경우 또는 열이 맵핑되지 않은 채로 있는 경우 수동으로 올바르게 맵핑하십시오. 또는 특정 열이 필요하지 않은 경우, 열 제외를 선택하여 IBM Match 360에 로드되지 않도록 제외할 수 있습니다.
열을 수동으로 맵핑하려면 해당 열을 선택한 후 대상 맵핑 패널을 사용하여 데이터 모델에서 적절한 속성 또는 필드를 검색하고 선택하십시오. 데이터 모델에 맵핑 및 저장을 클릭하십시오.

데이터 모델에 적절한 속성 또는 필드가 없는 경우 대상 맵핑 패널에서 하나를 작성할 수 있습니다. 새로 만들기 > 속성 만들기 또는 새로 만들기 > 필드 만들기를 클릭하여 새 속성 또는 필드에 대한 세부 정보를 정의하고 입력합니다.

기존 속성 유형을 지정하는 대신 단순 속성 을 작성하도록 선택하면 새 단순 속성이 모델링 탭의 레코드 유형에 직접 추가됩니다. 이는 속성 유형 아래에 카테고리화되지 않습니다.
열을 좌우로 화면 이동하여 데이터 소스 또는 자산의 모든 열이 맵핑되었는지 확인하십시오. 맵핑에서 맵핑, 자동 맵핑 또는 명시적으로 제외되지 않은 열이 있는 경우 데이터 자산은 진행 중인 맵핑 상태로 남아 있습니다.

열을 IBM Match 360에 로드되지 않도록 제외하려면 열을 선택한 다음 열 제외를 선택합니다.

중요: record_source 속성이 자산의 필드에 맵핑되는 경우 해당 필드는 모든 자산의 레코드에서 채워져야 합니다. record_source 필드의 값이 누락된 레코드가 있는 경우 자산을 로드할 수 없습니다. record_source 속성을 기존 필드에 맵핑하지 않으면 기본 레코드 소스 이름이 자산 이름을 사용하여 파생됩니다.
데이터 자산 맵핑을 완료하면 데이터를 시스템에 공개할 준비가 된 것입니다.
- 데이터 모델을 새로 만들거나 변경한 경우 먼저 작업 표시줄에서 모델 게시 아이콘 ' '을 클릭하여 모델을 게시합니다. 공개 작업이 완료하기를 기다리십시오.
- 데이터를 게시하려면 작업 표시줄에서 데이터 게시 아이콘 ' '을 클릭합니다. 공개 작업이 완료하기를 기다리십시오.
탐색 메뉴에서 구성 개요를 선택하여 구성 개요 페이지로 돌아가십시오.
구성 개요 페이지에서 추가되고 맵핑된 하나 이상의 데이터 소스 또는 자산이 있는지 확인하십시오.

데이터 자산에 맵핑 패턴 적용

맵핑 패턴을 사용하면 호환 가능한 자산에 대한 데이터 맵핑 선택사항을 쉽게 반복할 수 있으므로 유사한 데이터 자산에서 일관성을 유지할 수 있습니다.

데이터 자산을 수동으로 맵핑하면 맵핑 패턴이 자동으로 작성됩니다. 패턴은 동일한 열 형식 및 레코드 유형을 공유하는 다른 데이터 자산에서 재사용할 수 있도록 열 맵핑 선택사항을 저장합니다. 맵핑 패턴을 적용하면 이미 맵핑한 기존 자산과 유사한 데이터 자산을 수동으로 맵핑하지 않아도 됩니다.

IBM Match 360 은 새 자산이 시스템의 기존 맵핑 패턴과 호환되는 시기를 식별한 후 패턴을 사용하여 수동 맵핑 작업을 방지할 수 있음을 사용자에게 알립니다.

맵핑 패턴은 데이터 자산을 수동으로 맵핑하여 작성하거나 구성 스냅샷을 사용하여 가져올 수 있습니다.

구성 스냅샷을 사용하여 맵핑 패턴을 관리하고 적용하는 방법에 대한 정보는 구성 스냅샷 저장 및 로드를 참조하십시오.

맵핑되거나 맵핑되지 않은 데이터 자산에 맵핑 패턴을 적용하려면 다음을 수행하십시오.

자산 요약 화면에서 매핑 탭을 클릭합니다.
자산 목록에서 맵핑 패턴을 적용할 하나 이상의 데이터 자산을 찾으십시오.

원하는 자산을 쉽게 찾을 수 있도록 이름으로 검색하거나 열 수, 레코드 유형, 매핑 상태, 게시 상태 또는 사용 가능한 매핑 패턴을 기준으로 필터링할 수 있습니다. 필터 아이콘 ' '을 클릭하여 필터를 적용합니다.
맵핑 패턴을 적용할 데이터 자산을 선택하십시오.
- 단일 데이터 자산에 매핑 패턴을 적용하려면 자산 이름 옆에 있는 매핑 패턴 적용 아이콘 ' '을 클릭합니다.
- 하나 이상의 데이터 자산에 맵핑 패턴을 적용하려면 자산 이름 옆에 있는 선택란을 선택한 후 자산 목록에서 맵핑 적용 을 클릭하십시오. 맵핑 패턴을 공유하려면 선택한 데이터 자산이 동일한 구조 및 열 형식을 공유해야 합니다.
맵핑 패턴 적용 페이지에는 사용 가능한 맵핑 패턴 목록이 표시됩니다. 이 에셋에 권장 매칭 패턴이 있는 경우 옆에 ' ' 배지 아이콘이 표시됩니다.
맵핑 패턴을 검토하십시오. 적용 가능한 레코드 유형, 마지막 업데이트 날짜 및 원래 소스와 함께 맵핑 패턴이 현재 적용되는 다른 자산을 볼 수 있습니다.

세부사항을 보고 맵핑 패턴을 서로 비교하려면 기본 맵핑 패턴을 선택한 후 맵핑 패턴 비교를 클릭하십시오. 패턴을 가로로 스크롤하여 선택한 패턴과 비교하십시오. 스냅샷 세부사항 및 열 맵핑과 같은 세부사항을 보려면 페이지에서 수직으로 화면이동하십시오.
선택한 데이터 자산에 적용할 맵핑 패턴을 선택한 후 다음을 클릭하십시오.
선택한 맵핑 변경사항을 검토하십시오. 올바른 자산 및 맵핑 패턴을 선택했는지 확인하십시오.

맵핑 패턴을 적용하면 자산의 레코드 유형을 변경할 수 있습니다. 레코드 유형을 잘못 변경하지 않도록 주의하십시오. 맵핑 패턴을 적용하여 수행된 맵핑 변경사항은 자산을 수동으로 다시 맵핑하지 않으면 실행 취소할 수 없습니다.
완료 를 클릭하여 맵핑 패턴을 적용하십시오.
맵핑 패턴을 적용하면 데이터를 시스템에 공개할 준비가 된 것입니다.
- 데이터 모델을 새로 만들거나 변경한 경우 먼저 작업 표시줄에서 모델 게시 아이콘 ' '을 클릭하여 모델을 게시합니다. 공개 작업이 완료하기를 기다리십시오.
- 데이터를 게시하려면 작업 표시줄에서 데이터 게시 아이콘 ' '을 클릭합니다. 공개 작업이 완료하기를 기다리십시오.

플랫 데이터 파일에서 관계 데이터 추가

관계 데이터 자산을 IBM Match 360으로 로드하려면 먼저 데이터 모델에서 해당 관계 유형을 정의해야 합니다. 자세한 내용은 데이터 모델 사용자 정의를 참조하십시오.

팁: 새 관계 유형을 정의한 후 데이터 모델을 공개해야 합니다.

관계 데이터 자산은 구분된 행 (CSV 또는 TSV) 으로 형식화됩니다. 다음과 같은 여러 필수 데이터 열이 있습니다.

각 관계의 두 당사자에 대한 레코드 ID
각 관계의 두 당사자에 대한 레코드 유형
각 관계의 두 당사자에 대한 레코드 소스

ETL 프로세스를 통해 또는 관계가 저장된 애플리케이션을 사용하여 관계 데이터 자산을 수동으로 작성할 수 있습니다.

CSV 또는 TSV 데이터 파일에서 IBM Match 360 으로 관계 데이터를 추가하려면 다음을 수행하십시오.

마스터 데이터 탐색 메뉴에서 자산 아이콘 ' '을 클릭합니다.
레코드 데이터 자산을 IBM Match 360으로 로드, 맵핑 및 공개하십시오. 이러한 데이터 자산에는 관계를 사용하여 연관시킬 레코드 데이터가 포함되어야 합니다. 자세한 내용은 플랫 데이터 파일에서 레코드 데이터 추가 및 데이터 모델에 데이터 맵핑을 참조하십시오.
관계 데이터 자산 파일을 로드하십시오.

a. 작업 표시줄에서 데이터 추가 또는 프로젝트에 에셋 업로드 아이콘 ' '을 클릭합니다.

b. 열리는 데이터 패널에서, 프로젝트 또는 카탈로그로부터 업로드에 의해 데이터를 추가할지 여부를 선택하십시오. 데이터 파일을 업로드하려면 로드를 선택하십시오.

참고: 데이터에 통제된 카탈로그가 포함된 경우 일부 카탈로그 자산을 보거나 추가할 수 없습니다. 권한에 따라 사용자가 소유하거나 관리하는 카탈로그 자산만 볼 수 있습니다.

c. 로컬 컴퓨터에서 CSV 또는 TSV 형식의 관계 데이터가 포함된 플랫 데이터 파일을 선택하고 데이터 패널로 끌어오십시오. 파일이 업로드를 완료할 때 자산 요약 목록에 추가됩니다.
새로 추가된 관계 자산의 세부사항을 검토하십시오.
자산 요약 목록에서 관계 자산의 행 위에 마우스 커서를 두고 세 개의 점으로 된 오버플로우 메뉴를 클릭하십시오.
자산 특성 설정을 클릭하십시오.
자산 데이터 카테고리 목록에서 관계 를 선택하십시오.
자산 데이터 유형 목록에서 올바른 관계 유형을 선택하고 저장을 클릭하십시오.

자산 데이터 유형 목록에 적절한 관계 유형이 없는 경우 데이터 모델을 사용자 정의해야 할 수 있습니다. 자세한 정보는 데이터 모델 사용자 정의를 참조하십시오.
관계 데이터 자산을 맵핑하고 공개하십시오. 자세한 내용은 데이터 모델에 데이터 맵핑을 참조하십시오. 각 필수 데이터 열 ( from record ID, to record ID, from record type, to record type, from record source및 to record source) 을 맵핑해야 합니다.

제한사항: 관계 데이터는 프로파일링 및 자동 맵핑을 지원하지 않습니다. 데이터 모델에 열을 수동으로 맵핑하십시오.

샘플 데이터 공개

IBM Match 360 서비스를 사용하여 시작하려는 자체 데이터 자산이 없는 경우 제공된 샘플 데이터 및 모델을 대신 로드하십시오.

IBM Match 360 샘플 데이터를 로드하려면 다음을 수행하십시오.

마스터 데이터 홈 페이지로 이동하십시오.
마스터 데이터 타일에서 샘플 모델 게시를 클릭하십시오.
샘플 모델 게시가 완료되면 샘플 데이터 게시를 클릭하십시오.
원하는 경우 작업 페이지로 이동하여 샘플 로드 작업의 진행 상황을 확인합니다. 진행 상황을 보지 않으려는 경우 다른 화면으로 이동하여 작업이 백그라운드에서 계속 작동합니다.

다음 단계

자세한 정보

상위 주제: 마스터 데이터 구성하기