Sono disponibili diversi metodi per trattare i valori mancanti nei dati. È possibile scegliere di utilizzare la funzionalità disponibile in Data Refinery o nei nodi.
Funzioni disponibili in SPSS Modeler
In SPSS Modeler, esistono diverse funzioni utilizzate per gestire i valori mancanti. Per scartare o sostituire i valori mancanti, nei nodi Seleziona e Riempimento vengono spesso utilizzate le seguenti funzioni:
count_nulls(LIST
@BLANK(FIELD
@NULL(FIELD
undef
È possibile utilizzare le funzioni @
insieme alla funzione @FIELD
per
identificare la presenza di valori vuoti o null in uno o più campi. Semplicemente contrassegnare i campi
quando sono presenti valori vuoti o null o riempirli con valori di sostituzione o utilizzarli in molte altre
operazioni.
All'interno di un elenco di campi, i valori null si possono contare nel modo seguente:
count_nulls(['cardtenure' 'card2tenure' 'card3tenure'])
Quando si utilizzano funzioni che accettano come input un elenco di campi, è possibile utilizzare le
funzioni speciali @FIELDS_BETWEEN
e @FIELDS_MATCHING
come nell'esempio
seguente:
count_nulls(@FIELDS_MATCHING('card*'))
È possibile utilizzare la funzione undef
per riempire i campi con il valore mancante di sistema, visualizzato come $null$. Ad esempio, per sostituire qualsiasi valore numerico, è possibile utilizzare un'istruzione condizionale, come:
if not(Age > 17) or not(Age < 66) then undef else Age endif
Questo sostituisce tutto ciò che non è compreso nell'intervallo con un valore mancante di sistema, visualizzato come $null$. Utilizzando la funzione not()
, è possibile rilevare tutti gli altri valori numerici, inclusi quelli negativi.
and not
nell'espressione. Ad esempio, per selezionare e includere tutti i record in cui il tipo di farmaco da prescrizione è Drug C
, utilizzare la seguente istruzione select:Drug = 'drugC' and not(@NULL(Drug))