이 튜토리얼에서는 향후 판매 프로모션의 효과를 예측하는 두 가지 모델을 구축한 다음 두 모델을 비교합니다.
상태 모니터링 튜토리얼과 마찬가지로 데이터 마이닝 프로세스는 탐색, 데이터 준비, 교육 및 테스트 단계로 구성됩니다. ' telco.csv ' 데이터 파일에 있는 모든 데이터가 이탈 예측에 유용한 것은 아닙니다. 필터를 사용하여 예측자로 사용하기에 중요하다고 간주되는 데이터(모델에서 중요로 표시된 필드)만 선택할 수 있습니다.
튜토리얼 미리보기
Copy link to section
비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 동영상에 나오는 사용자 인터페이스와 약간의 차이가 있을 수 있습니다. 이 비디오는 글로 된 튜토리얼의 보조 자료로 제작되었습니다. 이 비디오는 이 문서에 있는 개념과 작업을 시각적으로 배울 수 있는 방법을 제공합니다.
소매 판매 프로모션에는 여러 노드가 포함됩니다. 다음 단계에 따라 데이터 자산, 파생 및 유형 노드를 검토합니다:
데이터 자산 노드
자산 탭에서 소매 판매 프로모션 모델러 흐름을 열고 캔버스가 로드될 때까지 기다립니다.
goods1n.csv 노드를 더블클릭합니다. 이 노드는 프로젝트의 goods1n.csv 파일을 가리키는 데이터 에셋 노드입니다.
파일 형식 속성을 검토합니다.
데이터 미리 보기를 클릭하여 전체 데이터 집합을 확인합니다.
각 레코드에는 다음이 포함됩니다:
Class. 제품 유형.
Cost. 단가.
Promotion. 특정 프로모션에 지출한 금액의 인덱스입니다.
Before. 프로모션 전 수익입니다.
After. 프로모션 후 수익입니다.
두 수입 필드(Before 및 After)는 절대 조건으로 표현됩니다. 그러나 프로모션 이후(그리고 아마도 프로모션의 결과로 인한) 매출 증가가 더 유용한 수치일 수 있습니다.
데이터 미리 보기와 속성 사이드 창을 닫습니다.
파생 노드
증가(파생) 노드를 두 번 클릭합니다. 이 노드는 수익 증가의 가치를 도출합니다.
프로모션 전 수익의 백분율로 증가율을 도출하는 수식이 포함된 표현식 필드, 특히 ' (After - Before) /
Before * 100.0 설정을 검토합니다.
데이터 미리 보기를 클릭하여 파생된 값이 포함된 데이터 집합을 확인합니다.
증가 열을 확인합니다.
각 제품 클래스에 대해 매출 증가와 판촉 비용 사이에 거의 선형 관계가 존재합니다. 따라서 의사결정 트리 또는 신경망이 상당한 정확도로 사용 가능한 기타 필드에서 수입이 증가함을 예측할 수 있습니다.
데이터 미리 보기와 속성 사이드 창을 닫습니다.
유형 노드
유형 정의(유형) 노드를 두 번 클릭합니다. 이 노드는 측정 수준(필드에 포함된 데이터 유형), 모델링에서 대상 또는 입력으로서 각 필드의 역할과 같은 필드 속성을 지정합니다. 측정 수준은 필드에서 데이터 유형을 나타내는 범주입니다. 소스 데이터 파일은 세 가지 측정 수준을 사용합니다:
연속형 필드(예: ' Age 필드)에는 연속형 숫자 값이 포함됩니다.
명목 필드(예: ' Education 필드)에는 두 개 이상의 고유한 값(이 경우 ' College ' 또는 ' High school')이 있습니다.
서수 필드(예: ' Income level 필드)는 고유한 순서를 가진 여러 개의 고유 값(이 경우 ' Low, ' Medium' , ' High')이 있는 데이터를 설명합니다.
각 필드에 대해 유형 노드는 각 필드가 모델링에서 수행하는 역할을 나타내는 역할도 지정합니다. 역할은 파생된 필드인 ' Increase' 필드에 대한 타깃으로 설정됩니다. ' target '은 값을 예측하려는 필드입니다.
대부분의 다른 필드에서는 역할이입력으로 설정됩니다. 입력 필드는 때때로 predictors 또는 목표 필드의 값을 예측하기 위해 모델링 알고리즘에서 값을 사용하는 필드로 알려져 있습니다.
' After ' 필드의 역할이 없음으로 설정되어 있으므로 이 필드는 모델링 알고리즘에서 사용되지 않습니다.
선택 사항입니다: 데이터 미리 보기를 클릭하여 파생된 값이 포함된 데이터 집합을 확인합니다.
진행 상황 확인
다음 이미지는 Type 노드를 보여줍니다. 이제 모델을 생성하고 비교할 준비가 되었습니다.
이 흐름은 이러한 수익 증가를 예측하기 위해 신경망과 의사결정 트리를 교육합니다. 다음 단계에 따라 두 모델을 생성합니다:
모델 생성
증가(신경망 ) 노드를 두 번 클릭하여 해당 속성을 검토합니다.
기본 사항 섹션을 확장하여 멀티레이어 퍼셉트론이 모델 유형인지 확인합니다. 이 속성은 네트워크가 숨겨진 레이어를 통해 예측자를 타겟에 연결하는 방법을 결정합니다. 다층 퍼셉트론을 사용하면 훈련 및 채점 시간이 늘어날 수 있는 대신 더 복잡한 관계를 만들 수 있습니다.
모델 옵션 섹션을 펼쳐 평가 및 채점 속성을 확인합니다.
증가(C&R 트리) 노드를 두 번 클릭하여 해당 속성을 확인합니다.
를 모두 실행하고, 모델 덩어리가 생성될 때까지 기다리십시오.
모델 비교
증가(C&R 트리 ) 모델 너겟을 증가(신경망)에 연결합니다.
분석 노드를 추가합니다:
팔레트에서 출력 섹션을 펼칩니다.
분석 노드를 캔버스로 드래그합니다.
증가(신경망 ) 모델 너겟을 분석 노드에 연결합니다.
분석에 다른 데이터를 사용하도록 데이터 집합을 변경합니다:
goods1n.csv 노드를 두 번 클릭하여 해당 속성을 확인합니다.
이력서 핥기 데이터 집합을 변경합니다.
데이터 자산 > GOODS2n.csv 이동합니다.
선택을 클릭하십시오.
저장 을 클릭하십시오.
분석 노드 위에 마우스를 올려놓고 실행 아이콘을 클릭하세요. .
출력 및 모델 창에서 분석이라는 이름의 출력을 클릭하여 결과를 확인합니다.
분석 결과, 특히 예측된 증가율과 정답 사이의 선형 상관관계를 보면 학습된 시스템이 높은 수준의 성공률로 매출 증가를 예측하고 있음을 알 수 있습니다.
추가 탐색은 훈련된 시스템이 상대적으로 큰 오류를 발생시키는 경우에 중점을 둘 수 있습니다. 이러한 오류는 예상되는 매출 증가율과 실제 증가율을 비교하여 파악할 수 있습니다. 그런 다음 SPSS Modeler 대화형 그래픽을 사용하여 그래프에서 이상값을 선택하고, 그 속성에서 데이터 설명 또는 학습 프로세스를 조정하여 정확도를 향상시킬 수 있습니다.
본 사이트의 쿠키 정보웹 사이트가 제대로 작동하려면 일부 쿠키가 필요합니다(필수사항). 또한 다른 쿠키는 사이트 사용을 분석하고 사용자 경험을 개선하며 광고를 목적으로 귀하의 동의에 따라 사용될 수 있습니다.자세한 정보는 쿠키 환경 설정 옵션을 확인해 주시기 바랍니다. IBM 웹사이트를 방문함으로써 귀하는 IBM의개인정보처리방침에 따라 당사가 정보를 처리하는 것에 동의합니다.원활한 탐색을 제공하기 위해 귀하의 쿠키 환경 설정은 여기에 나열된 IBM 웹 도메인 전체에서 공유됩니다.