0 / 0
영어 버전 문서로 돌아가기

병합 노드

마지막 업데이트 날짜: 2025년 2월 12일
병합 노드(SPSS Modeler)

병합 노드의 기능은 다중 입력 레코드를 가져와서 입력 필드 중 일부 또는 전부가 포함된 단일 출력 레코드를 작성하는 것입니다. 이는 내부 고객 데이터 및 구매한 인구 통계 데이터 등의 다양한 소스의 데이터를 병합하려고 할 때 유용한 조작입니다.

다음의 방법으로 데이터를 병합할 수 있습니다.

  • 순서별 병합은 가장 작은 데이터 소스가 고갈될 때까지 입력 순서로 모든 소스의 해당 레코드를 연결합니다. 이는 정렬 노드를 사용하여 데이터를 정렬한 이 옵션을 사용하는 경우 중요합니다.
  • Customer ID과(와) 같은 필드를 사용하여 병합하여 한 데이터 소스의 레코드를 다른 데이터 소스의 레코드와 일치시키는 방법을 지정합니다.. 내부 결합, 전체 외부 결합, 부분 외부 결합, 안티 결합을 포함한 여러 유형의 결합을 사용할 수 있습니다.
  • 조건별 병합은 병합을 수행하기 위해 충족할 조건을 지정할 수 있음을 의미합니다. 노드에서 작업 조건을 지정하거나 표현식 작성기를 사용하여 조건을 작성할 수 있습니다.

조인 유형

데이터 병합을 위해 키 필드를 사용하는 경우 제외되는 레코드 및 포함될 레코드에 대해 생각하는 데 시간을 사용하는 것이 유용할 수 있습니다. 여기에서 논의되는 다양한 결합이 있습니다. 결합의 두 가지 기본적인 유형을 내부 결합과 외부 결합이라고 합니다. 이러한 메소드는 키 필드의 공통 값(예: Customer ID)을 기반으로 관련 데이터 세트의 테이블을 병합하는 데 자주 사용됩니다. 내부 결합에서는 완전한 레코드만 포함하는 출력 데이터 세트와 정리 병합을 고려합니다. 외부 결합은 병합된 데이터의 완전한 데이터도 포함하지만 하나 이상의 입력 테이블의 고유 데이터를 포함할 수도 있게 합니다.

허용되는 결합 유형은 다음과 같이 더 자세히 설명됩니다.

내부 조인 내부 조인에는 키 필드의 값이 모든 입력 테이블에 공통인 레코드만 포함됩니다. 즉, 일치하지 않는 레코드는 출력 데이터 세트에 포함되지 않습니다.

전체 외부 조인 전체 외부 조인에는 입력 테이블의 일치하는 레코드와 일치하지 않는 레코드가 모두 포함됩니다. 왼쪽 및 오른쪽 외부 조인을 부분 외부 조인이라고 합니다.

부분 외부 조인 부분 외부 조인에는 지정된 테이블의 일치하지 않는 레코드뿐만 아니라 키 필드를 사용하여 일치하는 모든 레코드가 포함됩니다. (즉, 일부 테이블의 모든 레코드와 다른 테이블의 일치하는 레코드만). 노드 특성의 병합 옵션 아래에 외부 결합에 포함하기 위해 테이블(예: 여기에 표시된 A 및 B)을 선택할 수 있습니다. 부분 결합은 두 개의 테이블만 병합 중인 경우 왼쪽 또는 오른쪽 외부 결합이라고도 합니다. SPSS Modeler에서는 두 개 이상의 테이블을 병합할 수 있으므로 이를 부분 외부 결합으로 참조합니다.

안티 결합 조인 방지에는 첫 번째 입력 테이블에 대한 일치하지 않는 레코드만 포함됩니다(여기에 표시된 테이블 A). 이 유형의 결합은 내부 결합의 반대이며 출력 데이터 세트에 완전한 레코드를 포함하지 않습니다.

예를 들어, 한 데이터 세트에 농장에 대한 정보가 있고 다른 데이터 세트에 농장 관련 보험 클레임에 대한 정보가 있는 경우 병합 옵션을 사용하여 첫 번째 소스의 레코드를 두 번째 소스에 일치시킬 수 있습니다. 농장 표본에 있는 고객이 보험 클레임을 제기했는지 판별하려면 내부 결합 옵션을 사용하여 두 표본에서 모든 ID가 일치하는 위치를 표시하는 목록을 리턴하십시오.

그림 1. 내부 결합 병합의 표본 출력
내부 결합 병합의 표본 출력

전체 외부 결합 옵션을 사용하면 입력 테이블에서 일치하는 레코드와 일치하지 않는 레코드가 모두 리턴됩니다. 시스템 결측값($null$)이 불완전한 값에 사용됩니다.

그림 2. 전체 외부 결합 병합의 표본 출력
전체 외부 결합 병합의 표본 출력

부분 외부 결합은 키 필드를 사용하는 일치된 모든 레코드와 지정된 테이블의 일치하지 않는 레코드를 포함합니다. 테이블에는 ID 필드에서 일치된 모든 레코드와 첫 번째 데이터 세트에서 일치된 레코드가 표시됩니다.

그림 3. 부분 외부 결합 병합의 표본 출력
부분 외부 결합 병합의 표본 출력

안티 결합 옵션을 사용하는 경우 테이블은 첫 번째 입력 테이블에 대해 일치하지 않는 레코드만 리턴합니다.

그림 4. 안티 결합 병합의 표본 출력
안티 결합 병합의 표본 출력