0 / 0
영어 버전 문서로 돌아가기

값 옵션 설정

마지막 업데이트 날짜: 2025년 2월 12일
값 옵션 설정(SPSS Modeler)

유형 노드 설정 아래에 있는 값 모드 열에는 사전 정의된 값의 드롭 다운 목록이 표시됩니다. 이 목록에서 지정 옵션을 선택한 후 톱니 바퀴 아이콘을 클릭하면 선택한 필드에 대한 값을 읽고 지정하고 레이블 지정하고 처리하기 위한 옵션을 설정할 수 있는 새 화면이 열립니다.

다수의 제어는 모든 유형의 데이터에 대해 공통입니다. 이 공통 제어에 대해 여기서 설명합니다.

측도. 현재 선택된 측정 수준을 표시합니다. 데이터를 사용할 방식을 반영하도록 설정을 변경할 수 있습니다. 예를 들어, day_of_week라는 필드에 개별 날짜를 나타내는 숫자가 포함되어 있는 경우에는 각각의 범주를 개별적으로 조사하는 분포 노드를 작성하기 위해 이를 명목 데이터로 변경할 수 있습니다.

역할. 기계 학습 프로세스에 대한 입력 필드(예측변수 필드) 또는 대상 필드(예측 필드)인지 여부를 모델링 노드에 알리는 데 사용됩니다. 모두, 없음, 파티션, 분할, 빈도, 레코드 ID 등의 다른 역할도 사용할 수 있습니다.

값 모드. 선택한 필드에 대한 값을 판별할 모드를 선택하십시오. 값을 읽기 위한 선택사항은 다음과 같습니다.
  • 읽기. 노드 실행 시 값을 읽으려면 선택하십시오.
  • 패스. 현재 필드에 대한 데이터를 읽지 않으려면 선택하십시오.
  • 지정. 여기의 옵션은 선택한 필드에 대한 값과 레이블을 지정하는 데 사용됩니다. 값 확인과 함께 사용하여 이 옵션을 통해 현재 필드에 대한 사용자의 지식을 기반으로 하는 값을 지정하십시오. 이 옵션은 각 유형의 필드에 대한 고유 제어를 활성화합니다. 측정 수준이 유형 없음인 필드에 대해서는 값 또는 레이블을 지정할 수 없습니다.
  • 확장. 여기에 입력한 값이 포함된 현재 데이터를 붙여쓰려면 선택하십시오. 예를 들어,field_1(0,10) 의 범위가 있고 (8,16)의 값 범위를 입력하면 원래 최소값을 제거하지 않고 16 를 추가하여 범위가 확장됩니다. 새 범위는 (0,16)입니다.
  • 현재. 현재 데이터 값을 유지하려면 선택하십시오.

값 레이블(레이블 추가/편집). 이 섹션에서는 선택한 필드의 값 각각에 대해 사용자 정의 레이블을 입력할 수 있습니다.

최대 목록 길이. 측정 수준이 지리 공간 또는 콜렉션인 데이터에만 사용할 수 있습니다. 목록이 포함할 수 있는 요소 수를 지정하여 목록의 최대 길이를 설정하십시오.

최대 문자열 길이. 유형이 없는 데이터에만 사용할 수 있습니다. 테이블 작성을 위해 SQL을 생성하는 경우 이 필드를 사용하십시오. 데이터에서 가장 큰 문자열 값을 입력하십시오. 그러면 문자열을 포함하기에 충분히 열이 테이블에 생성됩니다. 문자열 길이 값을 사용할 수 없으면 데이터에 적합하지 않은 기본 문자열 값이 사용됩니다. 예를 들어, 값이 너무 작으면 테이블에 데이터를 쓸 때 오류가 발생할 수 있으며, 값이 너무 크면 성능에 불리한 영향을 미칠 수 있습니다.

확인. 지정된 연속형, 플래그 또는 명목 값을 준수하도록 값을 강제하는 방법을 선택하십시오. 이 옵션은 기본 유형 노드 설정의 검사 열에 해당하며 여기서 선택한 사항이 기본 설정의 값을 대체합니다. 값과 레이블을 지정하는 옵션과 함께 사용하면 값 검사를 통해 예측값을 가진 데이터의 값을 준수할 수 있습니다. 예를 들어, 값을 1, 0 로 지정한 후 버리기 를 사용하십시오. 여기서는 1 또는 0 이외의 값이 있는 모든 레코드를 삭제할 수 있습니다.

결측값 정의. 데이터에서 결측값 또는 공백을 선언하는 데 사용할 수 있는 다음 제어를 활성화하려면 선택하십시오.
  • 결측값. 특정 값(예: 99 또는 0)을 공백으로 정의하려면 이 필드를 사용하십시오. 값은 필드의 저장 유형에 대해 적합해야 합니다.
  • 범위. 결측값의 범위(예: 연령 1–17 또는 65 초과)를 지정하는 데 사용됩니다. 바운드 값이 공백이면 범위가 무제한입니다. 예를 들어, 상한 없이 하한으로 100을 지정하면 100 이상의 값은 모두 결측값으로 정의됩니다. 경계값도 포함됩니다. 예를 들어, 하한이 5이고 상한이 10인 범위의 범위 정의에는 510이 포함됩니다. 결측값 범위는 날짜/시간 및 문자열(이 경우 값이 범위 내에 있는지 판별하기 위해 알파벳 정렬 순서가 사용됨)을 포함한 모든 저장 유형에 대해 정의할 수 있습니다.
  • 널/공백. 시스템 널(데이터에서 $null$로 표시됨) 및 공백(표시되는 문자가 없는 문자열 값)을 공백으로 지정할 수도 있습니다. 유형 노드에서는 분석을 위해 빈 문자열도 공백으로 처리하지만 빈 문자열은 내부적으로 다르게 저장되며 특정 경우에 다르게 처리될 수 있습니다.
참고: 공백을 정의되지 않음 또는 $null$로 코딩하려면 채움 노드를 사용하십시오.