Définition des options des valeurs
La colonne Mode Valeur sous les paramètres de noeud Typer affiche une liste déroulante de valeurs prédéfinies. Sélectionnez l'option Spécifier dans cette liste, puis cliquez sur l'icône d'engrenage pour ouvrir un nouvel écran dans lequel vous pouvez définir des options pour la lecture, la spécification, l'étiquetage et le traitement des valeurs pour le champ sélectionné.
La majeure partie des contrôles sont communs à tous les types de données. Ces contrôles communs sont abordés ici.
Mesure. Affiche le type de niveau de mesure actuellement sélectionné. Vous pouvez modifier ce paramètre pour indiquer la façon dont vous souhaitez utiliser les données. Par exemple, si un champ nommé day_of_week
contient des nombres qui représentent des jours individuels, vous pouvez le changer pour des données nominales afin de créer un noeud de distribution qui examine chaque catégorie individuellement.
Rôle. Permet d'indiquer aux noeuds de modélisation si les champs sont Entrée (champs prédicteurs) ou Cible (champs prédits) pour un processus d'apprentissage automatique. D'autres rôles sont également disponibles, tels que Les deux , Aucun, Partition, Fractionner, Fréquence ou ID enregistrement.
- Lecture. Sélectionnez cette option pour lire les valeurs lorsque le noeud est exécuté.
- Passage. Sélectionnez cette option afin de ne pas lire les données pour le champ en cours.
- Spécifier. Ici, les options sont utilisées pour indiquer des valeurs et des libellés pour le champ sélectionné. Utilisées avec la vérification des valeurs, elles permettent de spécifier des valeurs en fonction de votre connaissance du champ en cours. Elle active des contrôles propres à chaque type de champ. Vous ne pouvez pas spécifier des valeurs ou des libellés pour un champ dont le niveau de mesure est Sans type.
- Etendre. Permet d'ajouter aux données actuelles les valeurs que vous entrez ici. Par exemple, sifield_1possède une plage comprise entre
(0,10)
et vous entrez une plage de valeurs comprise entre(8,16)
. La plage est étendue en ajoutant16
sans supprimer la valeur minimale d'origine. La nouvelle plage serait(0,16)
. - En cours. Sélectionnez cette option pour conserver les valeurs de données en cours.
Libellés de valeur (ajouter/éditer des libellés). Dans cette section, vous pouvez entrer des libellés personnalisés pour chaque valeur du champ sélectionné.
Longueur max. de la liste. Disponible seulement pour les données dont le niveau de mesure est Géospatial ou Collection. Définissez la longueur maximale de la liste en spécifiant le nombre d'éléments que la liste peut contenir.
Longueur de chaîne max. Uniquement disponible pour les données sans type. Utilisez ce champ lorsque vous générez du code SQL pour créer une table. Entrez la valeur de la plus grande chaîne de vos données ; cette opération génère une colonne dans la table qui est assez grande pour la chaîne. Si la valeur de longueur de chaîne n'est pas disponible, une taille de chaîne par défaut pouvant être inappropriée pour les données est utilisée (par exemple, une valeur trop petite peut générer des erreurs lors de l'écriture des données dans la table ; une valeur trop grande peut affecter défavorablement les performances).
Vérifier. Sélectionnez une méthode de conversion forcée des valeurs pour qu'elles soient conformes aux valeurs continues, indicateurs ou nominales spécifiées. Cette option correspond à la colonne Vérification dans les paramètres de noeud Typer principal et une sélection effectuée ici remplace celles des paramètres principaux. Utilisée avec les options de spécification des valeurs et des libellés, la vérification des valeurs vous permet de respecter les valeurs dans les données avec les valeurs escomptées. Par exemple, si vous spécifiez des valeurs sous la forme 1,
0
, utilisez la commande Discard. ici, vous pouvez supprimer tous les enregistrements avec des valeurs autres que 1
ou 0
.
- Valeurs manquantes. Utilisez ce champ pour définir des valeurs spécifiques (telles que
99
ou0
) comme des blancs. La valeur doit être adaptée au type de stockage du champ. - Plage. Utilisé pour spécifier une plage de valeurs manquantes (telles que les âges
1–17
ou supérieurs à65
). Si une valeur de limite est vide, la plage est sans limite. Par exemple, si vous spécifiez une limite inférieure de100
sans limite supérieure, toutes les valeurs supérieures ou égales à100
sont définies comme manquantes. Les valeurs liées sont inclusives. Par exemple, une plage dont la limite inférieure est5
et la limite supérieure est10
inclut5
et10
dans la définition de la plage. Vous pouvez définir une plage de valeurs manquantes pour n'importe quel type de stockage, y compris la date/l'heure et la chaîne (auquel cas l'ordre de tri alphabétique est utilisé pour déterminer si une valeur se trouve dans la plage). - Nul/Blanc. Vous pouvez également déterminer comme blancs les valeurs système nulles (affichées dans les données sous la forme
$null$
) et les espaces blancs (valeurs de chaîne comportant des caractères non visibles). Le noeud Typer traite également les chaînes vides comme des espaces blancs à des fins d'analyse, bien qu'elles soient stockées différemment en interne et gérées différemment dans certains cas.
$null$
, utilisez le noeud Remplacer.