SPSS Modeler 데이터를 처리하는 흐름을 설정하고 다양한 모델링 기법을 실험할 수 있습니다. 모델링 프로세스를 통해 예측 분석에 사용할 수 있는 조정된 모델을 만들 수 있습니다.
빌딩 흐름
흐름은 캔버스에서 연결하는 일련의 노드입니다.
- 플로우
- 플로우는 순서대로 연결된 데이터 처리 작업의 그룹입니다. 흐름은 각 작업을 통한 데이터의 흐름을 나타냅니다. 데이터는 데이터 소스에서 일련의 작업 순서를 통해 끝까지 흐릅니다. 일반적으로 흐름은 표나 차트와 같은 모델 또는 데이터 출력 유형으로 끝납니다.
흐름은 캔버스에 노드를 추가하고 연결하여 만들 수 있습니다.
- 캔버스
- 캔버스는 SPSS Modeler 기본 작업 영역으로, 여기서 흐름을 작성합니다.
- 노드
- 노드는 모듈화된 독립적인 작업 집합입니다. 노드는 이러한 작업을 그래픽으로 표현하는 방식이며, 각 노드에는 고유한 아이콘이 있습니다. 이러한 노드는 캔버스에서 더 복잡한 데이터 처리를 위해 흐름으로 서로 연결할 수 있습니다.
흐름에 모델링 노드를 추가할 수 있습니다. 각 모델링 노드는 서로 다른 모델링 기법입니다. 흐름에 여러 모델링 노드를 추가하여 데이터에 다양한 모델링 기법을 시도할 수 있습니다. 흐름 설정을 완료한 후에는 모델링 노드에서 데이터를 처리하고 분석할 수 있도록 실행할 수 있습니다.
모델링 프로세스
결과를 예측하는 능력은 예측 분석의 핵심 목표이며, 모델링 프로세스를 이해하는 것이 SPSS Modeler 사용의 핵심입니다.
모델은 데이터의 입력 필드 또는 변수 집합을 기반으로 결과를 예측하는 데 사용할 수 있는 규칙, 공식 또는 방정식의 집합입니다. 예를 들어, 금융 기관은 모델을 사용하여 과거 신청자들에 대해 이미 알고 있는 정보를 기반으로 대출 신청자의 위험이 낮은지(안전), 높은지(위험)를 예측할 수 있습니다. 조정된 모델은 SPSS Modeler 작업하는 목적 중 하나입니다.
모델링은 여러 번의 반복으로 수행됩니다. 일반적으로 기본 매개 변수를 사용하는 여러 모델링 노드를 실행할 수 있습니다. 그런 다음 모델링 노드의 매개 변수를 미세 조정하거나 데이터 준비 단계로 돌아가서 모델링 노드의 데이터를 조정할 수 있습니다.
SPSS Modeler 기계 학습, 인공 지능 및 통계에서 가져온 다양한 모델링 방법을 제공합니다. 노드 팔레트에서 사용할 수 있는 방법을 사용하여 데이터에서 새로운 정보를 도출하고 예측 모델을 개발할 수 있습니다. 각각의 방법은 그것만의 장점이 있으며 특정한 문제점 유형에 가장 적합합니다.
이러한 모델링 노드 중 하나에서 유망한 결과를 얻으면 해당 모델링 노드를 모델로 저장할 수 있습니다. 그런 다음 이 모델을 승격하여 실시간 예측 분석에 사용할 수 있도록 배포할 수 있습니다.
노드 팔레트
노드 팔레트에는 SPSS Modeler 사용할 수 있는 모든 노드가 있습니다. 기능에 따라 그룹으로 구성됩니다. 노드 팔레트의 모든 노드를 흐름에 추가할 수 있습니다.
노드 팔레트에 대한 자세한 내용은 노드 팔레트를 참조하세요.
SuperNodes
흐름의 전체 또는 일부를 SuperNode 저장할 수 있습니다. 이 SuperNode 다른 흐름의 노드처럼 사용할 수 있습니다. SuperNode 사용하면 캔버스를 복잡하게 만들 수 있는 긴 노드 시퀀스를 추가하지 않고도 흐름에 복잡한 처리 계층을 추가할 수 있습니다.
SuperNodes, 대한 자세한 내용은 SuperNodes 참조하세요.