0 / 0
영어 버전 문서로 돌아가기

결측값에 사용 가능한 함수

마지막 업데이트 날짜: 2025년 2월 12일
결측값에 사용 가능한 함수(SPSS Modeler)

데이터의 결측값을 처리하기 위해 다양한 방법을 사용할 수 있습니다. Data Refinery 또는 노드에서 사용 가능한 기능을 사용하도록 선택할 수 있습니다.

SPSS Modeler 에서 사용 가능한 함수

SPSS Modeler에는 결측값을 처리하는 데 사용되는 여러 함수가 있습니다. 다음 함수는 종종 결측값을 버리거나 채우기 위해 선택 및 채움 노드에 사용합니다.

  • count_nulls(LIST
  • @BLANK(FIELD
  • @NULL(FIELD
  • undef

@ 함수를 @FIELD 함수와 함께 사용하여 하나 이상의 필드에 공백이나 널값이 있는지 식별할 수 있습니다. 공백이나 널값이 있을 때 간단히 필드에 플래그를 지정하거나, 필드를 대체 값으로 채우거나 다양한 다른 작업에 사용할 수 있습니다.

다음과 같이 필드 목록 전체에 걸쳐 널을 계산할 수 있습니다.

count_nulls(['cardtenure' 'card2tenure' 'card3tenure'])

필드 목록을 입력으로 받아들이는 함수를 사용할 때 다음 예에 표시된 대로 특수 함수 @FIELDS_BETWEEN@FIELDS_MATCHING을 사용할 수 있습니다.

count_nulls(@FIELDS_MATCHING('card*'))

undef 함수를 사용하여 $null$로 표시되는 시스템 결측값이 있는 필드를 채울 수 있습니다. 예를 들어 숫자 값을 대체하기 위해 다음과 같은 조건문을 사용할 수 있습니다.

if not(Age > 17) or not(Age < 66) then undef else Age endif

이는 시스템 결측값($null$로 표시됨)이 있는 범위에 있지 않은 모든 항목을 대체합니다. not() 함수를 사용하여 음수를 포함하여 다른 모든 숫자 값을 포착할 수 있습니다.

레코드 삭제에 대한 참고: 선택 노드를 사용하여 레코드를 삭제할 때 구문은 세 개의 값이 있는 로직을 사용하고 자동으로 select문에 널값을 포함합니다. 널값(시스템 결측값)을 선택 표현식에서 제외하려면 표현식에서 and not을 사용하여 이를 명시적으로 지정해야 합니다. 예를 들어, 처방약의 유형이 Drug C인 모든 레코드를 선택하여 포함시키려면 다음 선택 명령문을 사용하십시오.
Drug = 'drugC' and not(@NULL(Drug))

Data Refinery에서 사용 가능한 함수

Data Refinery를 사용하여 결측값을 처리할 수도 있습니다. 다음 정보를 참조하십시오.