SPSS Modeler 데이터 마이닝
SPSS Modeler 워크플로는 데이터 마이닝을 위한 산업 간 표준 프로세스(CRISP-DM) 방법론을 기반으로 구축되었습니다. 이 방법론은 여러 단계로 구성된 대규모 프로젝트에서 SPSS Modeler 작업을 포함시킵니다. SPSS Modeler 작업하는 단계는 프로젝트를 사용하여 작업 및 자산을 관리하는 단계입니다.
데이터 마이닝 단계
CRISP-DM 방법론은 다음과 같은 단계로 구성됩니다.
- 비즈니스 이해
- 이 단계에서는 데이터 마이닝의 비즈니스 목표에 대해 가능한 한 많은 인사이트를 얻으려고 노력하세요. 이해 관계자와 만나 SPSS Modeler 사용하여 비즈니스 목표 또는 문제를 해결하는 방법을 결정합니다.
자세한 내용은 데이터 이해 및 준비하기를 참조하세요.
- 데이터 이해
- SPSS Modeler 흐름을 작성하기 전에 데이터를 수집하고 이해해야 합니다. 시간을 내어 데이터의 데이터 구조, 관계, 패턴을 이해하세요.
자세한 내용은 데이터 이해 및 준비하기를 참조하세요.
- 데이터 준비
- SPSS Modeler 모델을 훈련하기 전에 데이터를 준비해야 합니다. 데이터 마이닝에 최적화되도록 데이터를 처리하는 데 시간을 할애하세요.
자세한 내용은 데이터 이해 및 준비하기를 참조하세요.
- 모델링
- SPSS Modeler 흐름을 구축하여 데이터를 탐색하고, 다양한 모델을 시도하고, 관계를 조사하여 유용한 정보를 찾을 수 있습니다.
자세한 내용은 빌딩 흐름 및 모델을 참조하세요.
- 배치
예측 모델을 구축하고 학습한 후 watsonx.ai Runtime 서비스가 있는 경우 watsonx.ai Runtime 에 홍보할 수 있습니다.
자세한 내용은 SPSS Modeler 흐름 및 모델 홍보를 참조하십시오.
- 평가
- 모델과 예측의 품질을 평가하세요. 예를 들어, 흐름에 분석 노드를 추가하여 모델의 예측이 얼마나 정확한지 평가할 수 있습니다. 평가 노드를 사용하여 예측 모델을 비교하고 가장 적합한 모델을 찾을 수도 있습니다.
프로젝트 및 데이터 자산으로 작업하기
SPSS Modeler 사용한 모든 작업은 프로젝트 내에서 이루어집니다. 프로젝트에는 모든 데이터 자산과 흐름이 담겨 있습니다.
- 프로젝트에 대한 자세한 내용은 프로젝트에서 작업하기를 참조하세요
- 흐름에서 사용할 데이터를 프로젝트에 추가하는 방법에 대한 자세한 내용은 프로젝트에 데이터 추가를 참조하세요.
SPSS Modeler 을 데이터베이스와 같은 데이터 소스에 연결하여 SPSS Modeler 에서 데이터에 더 쉽게 액세스할 수 있습니다.
데이터 연결에 대한 자세한 내용은 지원되는 데이터 소스를 참조하십시오
SPSS Modeler Subscription 또는 SPSS Modeler 클라이언트에서 생성된 스트림( .str )을 가져올 수 있습니다. 가져온 흐름에 가져오기 또는 내보내기 노드가 하나 이상 포함된 경우 흐름을 열 때 노드를 변환할지 묻는 메시지가 표시됩니다.
자세한 내용은 SPSS Modeler 스트림 가져오기를 참조하세요.
스크립팅
SPSS Modeler 스크립팅을 사용하여 작업을 자동화할 수 있습니다. R, Python 또는 Spark용 Python, CLEM(Control Language for Expression Manipulation)으로 스크립트를 작성할 수 있습니다. CLEM은 플로우를 통해 데이터 스트림을 분석하고 조작하기 위한 언어입니다.
자세한 내용은 스크립팅 및 자동화를 참조하세요.