Différentes méthodes sont disponibles pour traiter les valeurs manquantes dans vos données. Vous pouvez choisir d'utiliser la fonctionnalité disponible dans Data Refinery ou dans des noeuds.
Fonctions disponibles dans SPSS Modeler
Dans SPSS Modeler, plusieurs fonctions sont utilisées pour gérer les valeurs manquantes. Les fonctions suivantes sont souvent utilisées dans les noeuds Sélectionner et Remplacer pour supprimer ou renseigner des valeurs manquantes :
count_nulls(LIST
@BLANK(FIELD
@NULL(FIELD
undef
Vous pouvez utiliser les fonctions @
en association avec la fonction @FIELD
pour identifier la présence de blancs ou de valeurs nulles dans un ou plusieurs champs. Marquez simplement les champs lorsque des valeurs vides ou nulles sont présentes, ou remplissez-les avec des valeurs de remplacement ou utilisez-les dans diverses autres opérations.
Vous pouvez compter les valeurs nulles dans une liste de champs de la manière suivante :
count_nulls(['cardtenure' 'card2tenure' 'card3tenure'])
Lors de l'utilisation des fonctions acceptant une liste de champs comme entrée, vous pouvez utiliser les fonctions spéciales @FIELDS_BETWEEN
et @FIELDS_MATCHING
, comme l'illustre l'exemple suivant :
count_nulls(@FIELDS_MATCHING('card*'))
Vous pouvez utiliser la fonction undef
pour remplir les champs avec la valeur système manquante, affichée sous la forme $null$. Par exemple, pour remplacer une valeur numérique, vous pouvez utiliser une instruction conditionnelle, telle que:
if not(Age > 17) or not(Age < 66) then undef else Age endif
Remplace tout ce qui ne se trouve pas dans la plage par une valeur système manquante, affichée sous la forme $null$. En utilisant la fonction not()
, vous pouvez intercepter toutes les autres valeurs numériques, y compris les valeurs négatives.
and not
dans l'expression. Par exemple, pour sélectionner et inclure tous les enregistrements dans lesquels le type de médicament de prescription est Drug C
(Médicament C), utilisez l'instruction SELECT suivante :Drug = 'drugC' and not(@NULL(Drug))