0 / 0
Zurück zur englischen Version der Dokumentation

Verfügbare Funktionen für fehlende Werte

Letzte Aktualisierung: 12. Feb. 2025
Verfügbare Funktionen für fehlende Werte (SPSS Modeler)

Für den Umgang mit fehlenden Werten in Ihren Daten stehen verschiedene Methoden zur Verfügung. Sie können die in Data Refinery oder in Knoten verfügbare Funktionalität verwenden.

In SPSS Modeler verfügbare Funktionen

In SPSS Modelergibt es mehrere Funktionen zur Behandlung fehlender Werte. Die folgenden Funktionen werden häufig in Auswahl- und Füllerknoten zum Verwerfen oder Auffüllen fehlender Werte verwendet.

  • count_nulls(LIST
  • @BLANK(FIELD
  • @NULL(FIELD
  • undef

Die @-Funktionen können in Verbindung mit der Funktion @FIELD verwendet werden, um vorhandene Leerzeichen oder Nullwerte in einem oder mehreren Feldern zu ermitteln. Markieren Sie einfach die Felder bei vorhandenen Leerzeichen oder Nullwerten, füllen Sie sie mit Ersatzwerten aus oder verwenden Sie sie in zahlreichen anderen Operationen.

Sie können Nullen folgendermaßen in einer Liste von Feldern zählen:

count_nulls(['cardtenure' 'card2tenure' 'card3tenure'])

Wenn Sie eine der Funktionen verwenden, die eine Liste von Feldern als Eingabe akzeptieren, können Sie die Sonderfunktionen @FIELDS_BETWEEN und @FIELDS_MATCHING wie im folgenden Beispiel gezeigt verwenden:

count_nulls(@FIELDS_MATCHING('card*'))

Sie können die Funktion "undef" verwenden, um Felder mit dem systemdefiniert fehlenden Wert auszufüllen, der als $null$ angezeigt wird. Wenn Sie z. B. einen numerischen Wert ersetzen möchten, können Sie eine bedingte Anweisung verwenden, z. B.:

if not(Age > 17) or not(Age < 66) then undef else Age endif

Dadurch wird alles, was nicht im Bereich liegt, durch einen systemdefiniert fehlenden Wert ersetzt, der als $null$angezeigt wird. Mit der Funktion not() können Sie alle anderen numerischen Werte abfangen, einschließlich aller negativen Werte.

Hinweis zum Verwerfen von Datensätzen: Wenn Sie einen Auswahlknoten zum Verwerfen von Datensätzen verwenden, beachten Sie, dass die Syntax Logik mit drei Werten verwendet und Nullwerte automatisch in SELECT-Anweisungen enthält. Um Nullwerte (systemdefiniert fehlende Werte) aus einem SELECT-Ausdruck auszuschließen, müssen Sie dies ausdrücklich angeben, indem Sie and not im Ausdruck verwenden. Um beispielsweise alle Datensätze auszuwählen und einzuschließen, bei denen der Typ des verschreibungspflichtigen Arzneimittels Drug Clautet, würden Sie die folgende Anweisung SELECT verwenden:
Drug = 'drugC' and not(@NULL(Drug))

In Data Refinery verfügbare Funktionen

Zur Behandlung fehlender Werte können Sie auch Data Refinery verwenden. Siehe hierzu die folgenden Informationen.