Translation not up to date
Dostępne są różne metody postępowania z brakującą wartością w danych. Użytkownik może wybrać funkcje dostępne w Data Refinery lub w węzłach SPSS Modeler .
Funkcje dostępne w programie SPSS Modeler
W programie SPSS Modeleristnieje kilka funkcji używanych do obsługi brakujących wartości. Następujące funkcje używane są często w węzłach selekcji i wypełniania do usuwania lub zastępowania braków danych:
count_nulls(LIST
@BLANK(FIELD
@NULL(FIELD
undef
Funkcji produktu @
można używać w połączeniu z funkcją @FIELD
w celu zidentyfikowania wartości pustych lub pustych w jednym lub większej liczby pól. Należy po prostu oznaczyć pola, jeśli występują puste lub puste wartości, lub wypełnić je wartościami zamiennymi lub użyć ich w wielu innych operacjach.
Możliwe jest określenie liczebności wartości null wśród zmiennych na liście, na przykład:
count_nulls(['cardtenure' 'card2tenure' 'card3tenure'])
W przypadku korzystania z dowolnych funkcji, które akceptują listę pól jako dane wejściowe, można użyć funkcji specjalnych @FIELDS_BETWEEN
i @FIELDS_MATCHING
, tak jak pokazano to w poniższym przykładzie:
count_nulls(@FIELDS_MATCHING('card*'))
Funkcji undef
można używać do wypełniania pól za pomocą braków danych systemowych, wyświetlanych jako $null$. Na przykład, aby zastąpić dowolną wartość liczbową, można użyć instrukcji warunkowej, takiej jak:
if not(Age > 17) or not(Age < 66) then undef else Age endif
Spowoduje to zastąpienie wszystkich elementów, które nie znajdują się w zakresie z brakującą wartością systemową, wyświetlonej jako $null$. Za pomocą funkcji not()
można wychwytywać wszystkie inne wartości liczbowe, w tym również wszelkie negatywy.
and not
w wyrażeniu. Na przykład, aby wybrać i uwzględnić wszystkie rekordy, w których typem leku na receptę jest Drug C
, należy użyć następującej instrukcji SELECT:Drug = 'drugC' and not(@NULL(Drug))