noeud agrégé
L'agrégation est une tâche de préparation de données fréquemment utilisée pour réduire la taille d'un jeu de données. Avant de procéder à l'agrégation, vous devez prendre le temps de nettoyer les données, en se concentrant en particulier sur les valeurs manquantes. Une agrégation, des informations potentiellement utiles concernant les valeurs manquantes, peut être perdue.
Vous pouvez utiliser un noeud Agréger pour remplacer une séquence d'enregistrements d'entrée par des enregistrements de sortie récapitulatifs et agrégés. Par exemple, vous pouvez avoir un ensemble d'enregistrements de ventes d'entrée tels que ceux indiqués dans le tableau suivant.
Ancienneté | Sexe | Région | Branche | Ventes |
---|---|---|---|---|
23 | M | S | 8 | 4 |
45 | M | S | 16 | 4 |
37 | M | S | 8 | 5 |
30 | M | S | 5 | 7 |
44 | M | N | 4 | 9 |
25 | M | N | 2 | 11 |
29 | F | S | 16 | 6 |
41 | F | N | 4 | 8 |
23 | F | N | 6 | 2 |
45 | F | N | 4 | 5 |
33 | F | N | 6 | 10 |
Vous pouvez agréger ces enregistrements avec Sex
et Region
comme zones clés. Choisissez ensuite d'agréger Age
avec le mode Moyenne et Sales
avec le mode Somme. Sélectionnez l'option de noeud d'agrégation Inclure le comptage des enregistrements dans le champ et la sortie agrégée est similaire au tableau suivant.
Âge (moyenne) | Sexe | Région | Ventes (somme) | Nombre d'enregistrements |
---|---|---|---|---|
35.5 | F | N | 25 | 4 |
29 | F | S | 6 | 1 |
34.5 | M | N | 20 | 2 |
33.75 | M | S | 20 | 4 |
À partir de cela, vous apprenez, par exemple, que l'âge moyen des quatre femmes dans la région du Nord est de 35,5 ans, et que le total de leurs ventes était de 25 unités.
Branch
sont automatiquement supprimées lorsqu'aucun mode d'agrégation n'est spécifié.