이 튜토리얼에서는 고객에게 가장 적합한 오퍼와 오퍼가 수락될 확률을 예측하기 위한 모델을 생성하고 업데이트할 수 있는 SLRM(자가 학습 응답 모델) 노드를 사용합니다. 이러한 종류의 모델은 마케팅 애플리케이션 또는 콜센터와 같은 고객 관계 관리에서 유용성이 가장 높습니다.
이 예는 가상의 금융 기관을 기반으로 합니다. 마케팅 부서는 각 고객에게 적절한 금융 서비스를 제공함으로써 향후 캠페인에서 보다 수익성 있는 결과를 얻기를 원합니다. 구체적으로 이 예에서는 SLRM(Self-Learning Response Model) 모델을 사용하여 이전 오퍼 및 응답을 기반으로 긍정적으로 반응할 가능성이 가장 높은 고객의 특성을 식별하고 결과에 따라 현재 최고의 오퍼를 홍보합니다.
튜토리얼을 사용해 보세요
이 학습서에서는 다음 태스크를 완료합니다.
모델러 흐름 및 데이터 세트 샘플
이 튜토리얼에서는 샘플 프로젝트의 고객에게 오퍼 만들기 - 자가 학습 플로우를 사용합니다. 사용되는 데이터 파일은 pm_customer_train1.csv pm_customer_train2.csv 및 pm_customer_train3.csv. 다음 이미지는 샘플 모델러의 흐름을 보여줍니다.
작업 1: 샘플 프로젝트 열기
샘플 프로젝트에는 여러 데이터 세트와 샘플 모델러 흐름이 포함되어 있습니다. 아직 샘플 프로젝트가 없는 경우 튜토리얼 주제를 참조하여 샘플 프로젝트를 만드세요. 그런 다음 다음 단계에 따라 샘플 프로젝트를 엽니다:
- ' watsonx'의 탐색 메뉴 ' '에서 프로젝트 > 모든 프로젝트 보기를 선택합니다.
- SPSS Modeler 프로젝트를 클릭합니다.
- 자산 탭을 클릭하면 데이터 세트와 모델러 흐름을 볼 수 있습니다.
진행 상황 확인
다음 이미지는 프로젝트 자산 탭을 보여줍니다. 이제 이 튜토리얼과 관련된 샘플 모델러 플로우로 작업할 준비가 되었습니다.
작업 2: 데이터 자산 및 필러 노드 살펴보기
고객에게 오퍼 만들기 - 자가 학습 모델러 플로우에는 여러 노드가 포함되어 있습니다. 데이터 에셋 및 필러 노드를 검토하려면 다음 단계를 따르세요:
- 자산 탭에서 고객에게 오퍼 만들기 - 자가 학습 모델러 플로우를 열고 캔버스가 로드될 때까지 기다립니다.
- pm_customer_train1.csv 노드를 두 번 클릭합니다. 이 노드는 프로젝트의 pm_customer_train1.csv 파일을 가리키는 데이터 에셋 노드입니다.
- 파일 형식 속성을 검토합니다.
- 선택 사항입니다: 데이터 미리 보기를 클릭하여 전체 데이터 집합을 확인합니다.
- 필러 노드를 두 번 클릭합니다.필러 노드는 필드 값을 바꾸고 저장소를 변경하는 데 사용됩니다. 지정된 CLEM 조건(예:
@BLANK(FIELD)
)을 기준으로 값을 대체할 수 있습니다. 또는 모든 공백 또는 널값을 특정 값으로 대체할 것을 선택할 수 있습니다. 필러 노드는 누락된 값을 대체하기 위해 Type 노드와 함께 자주 사용됩니다.필드 채우기 섹션에서 값을 검사하고 바꾸려는 데이터 집합의 필드를 지정할 수 있습니다. 이 경우 'campaign
' 열은 바꾸기 섹션에서 항상 선택과 함께 지정됩니다. - 취소를 클릭합니다.
진행 상황 확인
다음 이미지는 필러 노드를 보여줍니다. 이제 유형 및 재분류 노드를 검토할 준비가 되었습니다.
작업 3: 유형 및 재분류 노드 검사하기
유형 및 재분류 노드를 검토하려면 다음 단계를 따르세요:
- 유형 노드를 더블클릭하여 해당 속성을 확인합니다.유형 노드를 사용하면 사용 중인 필드의 유형과 결과를 예측하는 데 사용되는 방식을 나타낼 수 있습니다. '
campaign
' 및 'response
' 필드의 역할이 Target으로 설정되어 있습니다. 지정된 대상은 예측의 기반이 되는 필드입니다. 측정값은 'response
' 필드에 대해 플래그로 설정됩니다. - 값 읽기를 클릭합니다.
- 저장 을 클릭하십시오.
캠페인 필드 데이터는 숫자 목록(1, 2, 3및 4)으로 표시되므로 필드를 재분류하여 더 의미 있는 제목을 사용할 수 있습니다.
- 재분류 노드를 두 번 클릭하여 해당 속성을 확인합니다.
- 재분류 대상 섹션에서 기존 필드를 선택합니다.
- 다음으로 필드 재분류 섹션에서 캠페인을 선택합니다.
- 값 가져오기를 클릭합니다. 캠페인 값은 '
ORIGINAL VALUE
' 열에 추가됩니다. - '
NEW VALUE
열의 값 섹션에 4개의 행이 있음을 알 수 있습니다:- Mortgage
- Car loan
- Savings
- Pension
- 저장 을 클릭하십시오.
진행 상황 확인
다음 이미지는 재분류 노드를 보여줍니다. 이제 SLRM 노드를 탐색할 준비가 되었습니다.
작업 4: SLRM 노드 살펴보기
SLRM 노드를 탐색하려면 다음 단계를 따르세요:
- 캠페인(SLRM ) 노드를 두 번 클릭하여 해당 속성을 확인합니다.
- 타겟 필드에'
campaign
'을 선택하고 타겟 응답 필드에'response
'를 선택합니다. - 모델 옵션에서 레코드당 최대 예측 수에서 숫자를 2로 줄입니다. 즉, 각 고객에 대해 수락 확률이 가장 높은 두 개의 오퍼가 식별됩니다.
- 모델 신뢰성 고려가 선택되어 있는지 확인합니다.
- 저장 을 클릭하십시오.
진행 상황 확인
다음 이미지는 플로우를 보여줍니다. 이제 모델을 생성할 준비가 되었습니다.
작업 5: 모델 생성
다음 단계에 따라 모델을 생성합니다:
- 캠페인(SLRM ) 노드 위로 마우스를 가져간 후 실행 아이콘 ' '을 클릭합니다.
- 출력 및 모델 창에서 캠페인 모델을 클릭하여 결과를 확인합니다.
초기 보기에는 각 오퍼에 대한 예측의 예상 정확도가 표시됩니다. 또한 예측변수 중요도를 클릭하여 모델 추정 시 각 예측변수의 상대적 중요도를 확인하거나 응답과 연관을 클릭하여 각 예측변수와 대상 변수의 상관 관계를 표시할 수 있습니다.
- 예측이 있는 4개의 오퍼를 각각 전환하려면 보기 메뉴를 사용합니다.
- 플로우로 돌아가십시오.
진행 상황 확인
다음 이미지는 플로우를 보여줍니다. 이제 다른 데이터 자산 노드로 실험할 준비가 되었습니다.
작업 6: 다른 데이터 자산 노드로 실험하기
다른 데이터 자산 노드를 실험하려면 다음 단계를 따르세요:
- 필러 노드에서 pm_customer_train1.csv 노드를 분리합니다.
- pm_customer_train2.csv 노드를 필러 노드에 연결합니다.
- 캠페인(SLRM) 노드를 두 번 클릭하고 빌드 옵션에서 기존 모델 계속 훈련이 선택되어 있는지 확인합니다.
- 저장 을 클릭하십시오.
- 플로우를 실행하여 모델 너깃을 다시 생성하십시오. 캠페인(SLRM ) 노드 위로 마우스를 가져간 후 실행 아이콘 ' '을 클릭합니다.
- 출력 및 모델 창에서 캠페인 모델을 클릭하여 결과를 확인합니다. 이제 모델은 각 오퍼에 대한 예측의 정확도에 대한 수정된 추정값을 표시합니다.
- 필러 노드에서 pm_customer_train2.csv 노드를 분리합니다.
- pm_customer_train3.csv 노드를 필러 노드에 연결합니다.
- 플로우를 실행하여 모델 너깃을 다시 생성하십시오. 캠페인(SLRM ) 노드 위로 마우스를 가져간 후 실행 아이콘 ' '을 클릭합니다.
- 출력 및 모델 창에서 캠페인 모델을 클릭하여 결과를 확인합니다.
이제 모델은 각 오퍼에 대한 예측의 최종 추정 정확도를 표시합니다. 보이는 바와 같이 추가 데이터 소스를 추가하면서 평균 정확도가 약간 떨어졌습니다. 그러나 이러한 변동은 미미한 수준이며 사용 가능한 데이터 내에서 약간의 이상 현상으로 인한 것일 수 있습니다.
- 테이블 노드 위로 마우스를 가져간 다음 실행 아이콘 ' '을 클릭합니다.
- 출력 및 모델 창에서 테이블 모델을 클릭하여 결과를 확인합니다.
표의 예측은 각 고객의 세부 정보에 따라 고객이 수락할 가능성이 가장 높은 오퍼와 해당 오퍼를 수락할 확률을 보여줍니다. 예를 들어, 첫 번째 행에서 이전에 자동차 대출을 받은 고객이 연금이 제공될 경우 이를 수락할 확률은 13.2(' $SC-campaign-1
' 열의 ' 0.132
' 값으로 표시됨)에 불과합니다. 그러나 두 번째와 세 번째 줄에는 자동차 대출을 받은 고객이 두 명 더 있는데, 이들의 경우 자신과 비슷한 이력을 가진 다른 고객이 적금을 권유하면 적금을 개설할 확률은 95.7, 연금을 받을 확률은 80%가 넘습니다.
SPSS Modeler 사용되는 모델링 방법의 수학적 기초에 대한 설명은 SPSS Modeler 알고리즘 가이드에서 확인할 수 있습니다.
이러한 결과는 학습 데이터만을 기반으로 합니다. 모델이 실제 세계의 다른 데이터에 얼마나 잘 일반화되는지 평가하기 위해 테스트 및 유효성 검사를 위해 파티션 노드를 사용하여 레코드의 하위 집합을 보관합니다.
진행 상황 확인
다음 이미지는 플로우를 보여줍니다.
요약
이 예에서는 SLRM(Self-Learning Response Model) 노드를 사용하여 각 고객의 세부 정보에 따라 고객이 수락할 가능성이 가장 높은 오퍼와 오퍼를 수락할 확률을 예측하는 방법을 보여 줍니다.
다음 단계
이제 다른 SPSS® Modeler 튜토리얼을 사용해 볼 준비가 되었습니다.