영어 버전 문서로 돌아가기
결측값에 사용 가능한 함수(SPSS Modeler)
결측값에 사용 가능한 함수
마지막 업데이트 날짜: 2025년 2월 12일
데이터의 결측값을 처리하기 위해 다양한 방법을 사용할 수 있습니다. Data Refinery 또는 노드에서 사용 가능한 기능을 사용하도록 선택할 수 있습니다.
SPSS Modeler 에서 사용 가능한 함수
SPSS Modeler에는 결측값을 처리하는 데 사용되는 여러 함수가 있습니다. 다음 함수는 종종 결측값을 버리거나 채우기 위해 선택 및 채움 노드에 사용합니다.
count_nulls(LIST
@BLANK(FIELD
@NULL(FIELD
undef
@
함수를 @FIELD
함수와 함께 사용하여 하나 이상의 필드에 공백이나 널값이 있는지 식별할 수 있습니다. 공백이나 널값이 있을 때 간단히 필드에 플래그를 지정하거나, 필드를 대체 값으로 채우거나 다양한 다른 작업에 사용할 수 있습니다.
다음과 같이 필드 목록 전체에 걸쳐 널을 계산할 수 있습니다.
count_nulls(['cardtenure' 'card2tenure' 'card3tenure'])
필드 목록을 입력으로 받아들이는 함수를 사용할 때 다음 예에 표시된 대로 특수 함수 @FIELDS_BETWEEN
및 @FIELDS_MATCHING
을 사용할 수 있습니다.
count_nulls(@FIELDS_MATCHING('card*'))
undef
함수를 사용하여 $null$로 표시되는 시스템 결측값이 있는 필드를 채울 수 있습니다. 예를 들어 숫자 값을 대체하기 위해 다음과 같은 조건문을 사용할 수 있습니다.
if not(Age > 17) or not(Age < 66) then undef else Age endif
이는 시스템 결측값($null$로 표시됨)이 있는 범위에 있지 않은 모든 항목을 대체합니다. not()
함수를 사용하여 음수를 포함하여 다른 모든 숫자 값을 포착할 수 있습니다.
레코드 삭제에 대한 참고: 선택 노드를 사용하여 레코드를 삭제할 때 구문은 세 개의 값이 있는 로직을 사용하고 자동으로 select문에 널값을 포함합니다. 널값(시스템 결측값)을 선택 표현식에서 제외하려면 표현식에서
and not
을 사용하여 이를 명시적으로 지정해야 합니다. 예를 들어, 처방약의 유형이 Drug C
인 모든 레코드를 선택하여 포함시키려면 다음 선택 명령문을 사용하십시오.Drug = 'drugC' and not(@NULL(Drug))
Data Refinery에서 사용 가능한 함수
Data Refinery를 사용하여 결측값을 처리할 수도 있습니다. 다음 정보를 참조하십시오.
주제가 도움이 되었습니까?
0/1000