L'agrégation est une tâche de préparation des données fréquemment utilisée pour réduire la taille d'un ensemble de données. Avant d'effectuer l'agrégation, vous devez prendre le temps de nettoyer les données, en vous concentrant notamment sur les valeurs manquantes. Une agrégation, des informations potentiellement utiles concernant les valeurs manquantes, peut être perdue.
Les noeuds Agréger permettent de remplacer une séquence d'enregistrements d'entrée par des enregistrements de sortie récapitulatifs et agrégés. Prenons par exemple les enregistrements de ventes d'entrée, tels que ceux affichés dans le tableau ci-après.
Age | Sexe | Région | Branche | Ventes |
---|---|---|---|---|
23 | M | S | 8 | 4 |
45 | M | S | 16 | 4 |
37 | M | S | 8 | 5 |
30 | M | S | 5 | 7 |
44 | M | N | 4 | 9 |
25 | M | N | 2 | 11 |
29 | F | S | 16 | 6 |
41 | F | N | 4 | 8 |
23 | F | N | 6 | 2 |
45 | F | N | 4 | 5 |
33 | F | N | 6 | 10 |
Vous pouvez agréger ces enregistrements avec Sex
et Region
comme zones clés. Choisissez ensuite d'agréger Age
avec le mode Moyenne et Sales
avec le mode Somme. Sélectionnez l'option de noeud d'agrégation Inclure le comptage des enregistrements dans le champ et la sortie agrégée est similaire au tableau suivant.
Age (moyenne) | Sexe | Région | Ventes (somme) | Nombre d'enregistrements |
---|---|---|---|---|
35.5 | F | N | 25 | 4 |
29 | F | S | 6 | 1 |
34.5 | M | N | 20 | 2 |
33.75 | M | S | 20 | 4 |
Ceci vous apprend par exemple que l'âge moyen des quatre membres féminins de l'équipe de vente dans la région nord est de 35,5 ans et que le montant total de leurs ventes était de 25 unités.
Branch
sont automatiquement supprimées lorsqu'aucun mode d'agrégation n'est spécifié.