Hay diferentes métodos disponibles para tratar los valores perdidos en los datos. Puede optar por utilizar la funcionalidad disponible en Data Refinery o en los nodos de SPSS Modeler .
Funciones disponibles en SPSS Modeler
En SPSS Modeler, hay varias funciones utilizadas para manejar los valores perdidos. Las siguientes funciones suelen utilizarse en los nodos Seleccionar y Rellenar para descartar o rellenar valores perdidos:
count_nulls(LIST
@BLANK(FIELD
@NULL(FIELD
undef
Puede utilizar las funciones @
junto con la función @FIELD
para identificar la presencia de valores nulos o vacíos en uno o varios campos. Simplemente marque los campos cuando contengan valores en blanco o nulos, o bien rellénalos con valores de sustitución o utilícelos en otras operaciones.
Puede contar nulos en una lista de campos, de la siguiente manera:
count_nulls(['cardtenure' 'card2tenure' 'card3tenure'])
Cuando utilice alguna de las funciones que aceptan una lista de campos como entrada, puede utilizar las funciones especiales @FIELDS_BETWEEN
y @FIELDS_MATCHING
, tal como se muestra en el siguiente ejemplo:
count_nulls(@FIELDS_MATCHING('card*'))
Puede utilizar la función undef
para rellenar campos con el valor perdido del sistema, que se visualiza como $null$. Por ejemplo, para sustituir cualquier valor numérico, puede utilizar una sentencia condicional, como por ejemplo:
if not(Age > 17) or not(Age < 66) then undef else Age endif
Esto sustituye cualquier cosa que no esté en el rango con un valor perdido del sistema, que se visualiza como $null$. Al utilizar la función not()
, puede capturar todos los demás valores numéricos, incluidos los negativos.
and not
en la expresión. Por ejemplo, para seleccionar e incluir todos los registros donde el tipo de medicamento prescrito es Drug C
, deberá utilizar la siguiente instrucción de selección:Drug = 'drugC' and not(@NULL(Drug))