이 튜토리얼에서는 입력 필드 값을 기반으로 레코드를 분류하는 통계 기법인 로지스틱 회귀 모델을 구축합니다. 선형 회귀와 유사하지만 숫자 1대신 범주형 대상 필드를 사용합니다.
예를 들어 한 통신 사업자가 서비스 사용 패턴에 따라 고객 기반을 세분화하여 고객을 네 그룹으로 분류했다고 가정해 보겠습니다. 소속 그룹을 예측하기 위해 인구 통계학적 데이터를 사용하면 개별 잠재 고객에 대한 오퍼를 사용자 정의할 수 있습니다.
튜토리얼 미리보기
Copy link to section
비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 동영상에 나오는 사용자 인터페이스와 약간의 차이가 있을 수 있습니다. 이 비디오는 글로 된 튜토리얼의 보조 자료로 제작되었습니다. 이 비디오는 이 문서에 있는 개념과 작업을 시각적으로 배울 수 있는 방법을 제공합니다.
통신 고객 분류 모델러 흐름에는 여러 노드가 포함되어 있습니다. 다음 단계에 따라 세 개의 노드를 검사합니다:
자산 탭에서 통신 고객 분류 모델러 플로우를 열고 캔버스가 로드될 때까지 기다립니다.
telco.csv 노드를 두 번 클릭합니다. 이 노드는 프로젝트의 telco.csv 파일을 가리키는 데이터 에셋 노드입니다.
파일 형식 속성을 검토합니다.
선택 사항입니다: 데이터 미리 보기를 클릭하여 전체 데이터 집합을 확인합니다.
유형 노드를 두 번 클릭하고 값 읽기를 클릭합니다. 이 노드는 측정 수준(필드에 포함된 데이터 유형), 모델링에서 대상 또는 입력으로서 각 필드의 역할과 같은 필드 속성을 지정합니다. 모든 측정 레벨이 올바르게 설정되었는지 확인하세요. 예를 들어, 0.0 및 1.0 값이 있는 대부분의 필드를 플래그로 간주할 수 있습니다.
그림 3. 측정 수준
' gender '은 플래그가 아닌 두 개의 값 집합이 있는 필드로 간주하는 것이 더 정확하므로 측정값은 공칭으로 남겨둡니다.
custcat 필드의 역할을 대상으로 설정하십시오. 다른 모든 필드에 대한 역할을 입력으로 설정된 상태로 두십시오.
필터 노드를 두 번 클릭하여 해당 속성을 확인합니다.
이 노드는 관련 필드만 필터링합니다: ' region, ' age' , ' marital' , ' address' , ' income' , ' ed' , ' employ' , ' retire' , ' gender' , ' reside' , 그리고 ' custcat' ). 이 분석에서 다른 필드는 제외됩니다.
진행 상황 확인
다음 이미지는 필터 노드를 보여줍니다. 이제 Logistic 노드를 볼 준비가 되었습니다.
본 사이트의 쿠키 정보웹 사이트가 제대로 작동하려면 일부 쿠키가 필요합니다(필수사항). 또한 다른 쿠키는 사이트 사용을 분석하고 사용자 경험을 개선하며 광고를 목적으로 귀하의 동의에 따라 사용될 수 있습니다.자세한 정보는 쿠키 환경 설정 옵션을 확인해 주시기 바랍니다. IBM 웹사이트를 방문함으로써 귀하는 IBM의개인정보처리방침에 따라 당사가 정보를 처리하는 것에 동의합니다.원활한 탐색을 제공하기 위해 귀하의 쿠키 환경 설정은 여기에 나열된 IBM 웹 도메인 전체에서 공유됩니다.