0 / 0
영어 버전 문서로 돌아가기

구간화 노드

마지막 업데이트 날짜: 2025년 2월 12일
구간화 노드(SPSS Modeler)

구간화 노드를 사용하면 하나 이상의 기존 연속(숫자 범위) 필드 값에 기반하여 새 명목 필드를 자동으로 작성할 수 있습니다. 예를 들어, 연속 수입 필드를 동일한 너비의 수입 그룹이 포함된 새 범주형 필드로 변환하거나 평균의 편차로 변환할 수 있습니다. 또는 두 필드 간 원래 연관의 강도를 유지하기 위해 범주형 "수퍼바이저" 필드를 선택할 수 있습니다.

다음과 같은 여러 가지 이유로 구간화가 유용할 수 있습니다.

  • 알고리즘 요구사항. Naive Bayes, 로지스틱 회귀분석과 같은 특정 알고리즘에는 범주형 입력이 필요합니다.
  • 성능. 입력 필드의 고유 값 수가 감소되면 다항 로지스틱과 같은 알고리즘의 성능이 향상될 수 있습니다. 예를 들어, 원래 값을 사용하지 않고 각 구간에 대해 중앙값 또는 평균 값을 사용하십시오.
  • Data Privacy. 급여와 같은 민감한 개인 정보는 개인정보를 보호하기 위해 실제 급여 수치가 아닌 범위로 보고될 수 있습니다.

여러 구간화 방법을 사용할 수 있습니다. 새 필드에 대한 구간을 작성한 후 절단점을 기반으로 파생 노드를 생성할 수 있습니다.

구간화 노드 사용 시기

구간화 노드를 사용하기 전에 다른 기술이 즉시 사용되는 작업에 보다 적절한지 여부를 고려하십시오.

  • 사전정의된 특정 급여 범위와 같은 범주의 절단점을 수동으로 지정하려면 파생 노드를 사용하십시오. 자세한 정보는 파생 노드 를 참조하십시오.
  • 기존 세트의 새 범주를 작성하려면 재분류 노드를 사용하십시오. 자세한 정보는 재분류 노드 를 참조하십시오.

결측값 처리

구간화 노드는 다음과 같은 방법으로 결측값을 처리합니다.

  • 사용자 지정 공백. 공백으로 지정된 결측값은 변환 중 포함됩니다. 예를 들어, 유형 노드를 사용하여 공백 값을 표시하기 위해 –99를 지정한 경우 이 값이 구간화 프로세스에 포함됩니다. 구간화 중 공백을 무시하려면 채움 노드를 사용하여 공백 값을 시스템 널값으로 대체해야 합니다.
  • 시스템 결측값($null$). 널값은 구간화 변환 중 무시되며 변환 이후에 널을 유지합니다.

설정 탭은 사용 가능한 기술에 대한 옵션을 제공합니다. 보기 탭은 노드를 통해 이전에 실행된 데이터에 대해 설정된 절단점을 표시합니다.