L'une des fonctions les plus puissantes de " watsonx.ai Studio est la possibilité de modifier les valeurs des données et de dériver de nouveaux champs à partir de données existantes. Au cours des projets d'exploration de données très longs, il est courant d'effectuer plusieurs calculs tels que l'extraction d'un ID client d'une chaîne des données du log Web ou la création d'une valeur de durée de vie de client basée sur des données démographiques et de transaction. Toutes ces transformations peuvent être effectuées à l'aide des divers noeuds d'opérations sur les champs.
- Le noeud Calculer modifie les valeurs de données ou crée de nouveaux champs à partir d'un ou de plusieurs champs existants. Il crée des champs de type formule, indicateur, ensemble, nominal, statistiques, comptage et conditionnel.
- Le noeud Recoder transforme un ensemble de valeurs catégorielles en un autre. La recodification est utile pour réduire des catégories ou regrouper des données à analyser.
- Le noeud Discrétiser crée automatiquement des champs nominaux (ensemble) sur la base des valeurs d'un ou de plusieurs champs continus (intervalle numérique) existants. Par exemple, vous pouvez transformer un champ continu de revenus en un nouveau champ catégoriel contenant des groupes de revenus comme écarts par rapport à la moyenne. Après avoir créé des casiers pour le nouveau champ, vous pouvez générer un noeud Calculer en fonction des points de césure.
- Le noeud Binariser calcule plusieurs champs indicateurs en fonction des valeurs catégorielles définies pour un ou plusieurs champs nominaux.
- Le noeud Restructurer convertit un champ nominal ou un champ indicateur en un groupe de champs renseignés à partir des valeurs d'un autre champ. Par exemple, pour une zone nommée
payment type
, avec les valeurscredit
,cash
etdebit
, trois nouvelles zones sont créées (credit
,cash
,debit
), chacune pouvant contenir la valeur du paiement réel effectué.
Utilisation du noeud Calculer
A l'aide du noeud Calculer, vous pouvez créer six types de nouveau champ à partir d'un ou de plusieurs champs existants :
- Formule. Le nouveau champ est le résultat d'une expression CLEM arbitraire.
- Booléen. Le nouveau champ est un indicateur, représentant une condition spécifique.
- Nominal : Le nouveau champ est un champ nominal. Autrement dit, ses membres constituent un groupe de valeurs spécifiées.
- Etat. Le nouveau champ est l'un de deux états. Le passage d'un état à l'autre est déclenché par une condition donnée.
- Comptage. Le nouveau champ est basé sur le nombre de fois qu'une condition est vraie (true).
- Conditionnel. Le nouveau champ est la valeur de l'une des deux expressions, selon la valeur d'une condition.
Chacun de ces noeuds contient un ensemble d'options particulières. Ces options sont traitées dans des rubriques ultérieures.
- Exécution dans une base de données via la fonctionnalité SQL Pushback
- Exécution via un serveur Analytic Server distant
- Utilisation de fonctions qui s'exécutent dans le serveur Analytic Server intégré
- Calcul d'une liste
- Appel de fonctions spatiales