Translation not up to date
Agregacja to zadanie przygotowywania danych często stosowane do zmniejszenia wielkości zbioru danych. Przed wykonaniem agregacji należy wyczyścić dane, koncentrując się szczególnie na brakach danych. Agregacja, potencjalnie użyteczna informacja dotycząca brakujących wartości, może zostać utracona.
Węzeł Agregacja umożliwia zastąpienie sekwencji wprowadzanych rekordów podsumowaniem, czyli zagregowanymi rekordami wynikowymi. Przykładowo, dostępny może być zbiór rekordów danych wejściowych dotyczących sprzedaży, takich jak te pokazane w tabeli.
Wiek | Płeć | Region | Gałąź | Dział sprzedaży |
---|---|---|---|---|
23 | M | S | 8 | 4 |
45 | M | S | 16 | 4 |
37 | M | S | 8 | 5 |
30 | M | S | 5 | 7 |
44 | M | N | 4 | 9 |
25 | M | N | 2 | 11 |
29 | F | S | 16 | 6 |
41 | F | N | 4 | 8 |
23 | F | N | 6 | 2 |
45 | F | N | 4 | 5 |
33 | F | N | 6 | 10 |
Rekordy te można zagregować, przyjmując jako zmienne kluczowe Sex
(Płeć) i Region
. Następnie można przeprowadzić agregację według zmiennej Age
(Wiek), tryb Średnia oraz Sales
(Sprzedaż), tryb Suma. Wybierz opcję węzła zagregowanego Uwzględnij liczbę rekordów w polu , a zagregowane dane wyjściowe będą podobne do poniższej tabeli.
Age (mean) | Płeć | Region | Sales (sum) | Licznik rekordów |
---|---|---|---|---|
35,5 | F | N | 25 | 4 |
29 | F | S | 6 | 1 |
34,5 | M | N | 20 | 2 |
33,75 | M | S | 20 | 4 |
Na podstawie tych danych można się na przykład dowiedzieć, że średni wiek czterech kobiet (F) z działu sprzedaży w regionie północnym (N) wynosi 35,5, a suma łącznie ich sprzedaży to 25 jednostek.
Branch
, są automatycznie usuwane, gdy nie zostanie określony żaden tryb agregacji.