Verfügbare Funktionen für fehlende Werte
Für den Umgang mit fehlenden Werten in Ihren Daten stehen verschiedene Methoden zur Verfügung. Sie können die in Data Refinery oder in Knoten verfügbare Funktionalität verwenden.
In SPSS Modeler verfügbare Funktionen
In SPSS Modelergibt es mehrere Funktionen zur Behandlung fehlender Werte. Die folgenden Funktionen werden häufig in Auswahl- und Füllerknoten zum Verwerfen oder Auffüllen fehlender Werte verwendet.
count_nulls(LIST
@BLANK(FIELD
@NULL(FIELD
undef
Die @
-Funktionen können in Verbindung mit der Funktion @FIELD
verwendet werden, um vorhandene Leerzeichen oder Nullwerte in einem oder mehreren Feldern zu ermitteln. Markieren Sie einfach die Felder bei vorhandenen Leerzeichen oder Nullwerten, füllen Sie sie mit Ersatzwerten aus oder verwenden Sie sie in zahlreichen anderen Operationen.
Sie können Nullen folgendermaßen in einer Liste von Feldern zählen:
count_nulls(['cardtenure' 'card2tenure' 'card3tenure'])
Wenn Sie eine der Funktionen verwenden, die eine Liste von Feldern als Eingabe akzeptieren, können Sie die Sonderfunktionen @FIELDS_BETWEEN
und @FIELDS_MATCHING
wie im folgenden Beispiel gezeigt verwenden:
count_nulls(@FIELDS_MATCHING('card*'))
Sie können die Funktion "undef
" verwenden, um Felder mit dem systemdefiniert fehlenden Wert auszufüllen, der als $null$ angezeigt wird. Wenn Sie z. B. einen numerischen Wert ersetzen möchten, können Sie eine bedingte Anweisung verwenden, z. B.:
if not(Age > 17) or not(Age < 66) then undef else Age endif
Dadurch wird alles, was nicht im Bereich liegt, durch einen systemdefiniert fehlenden Wert ersetzt, der als $null$angezeigt wird. Mit der Funktion not()
können Sie alle anderen numerischen Werte abfangen, einschließlich aller negativen Werte.
and not
im Ausdruck verwenden. Um beispielsweise alle Datensätze auszuwählen und einzuschließen, bei denen der Typ des verschreibungspflichtigen Arzneimittels Drug C
lautet, würden Sie die folgende Anweisung SELECT verwenden:Drug = 'drugC' and not(@NULL(Drug))