Aggregation ist eine Vorbereitungsaufgabe, die häufig zur Reduzierung der Größe eines Datasets verwendet wird. Bevor Sie mit der Aggregation fortfahren, sollten Sie sich die Zeit nehmen, die Daten zu bereinigen. Achten Sie dabei insbesondere auf fehlende Daten. Eine Aggregation, potenziell nützliche Informationen zu fehlenden Werten können verloren gehen.
Mit einem Aggregatknoten können Sie eine Sequenz von Eingabedatensätzen mit aggregierten Übersichts-Ausgabedatensätzen ersetzen. Beispielsweise könnten Sie ein Set von Eingabeverkaufsdatensätzen haben, ähnlich den in der folgenden Tabelle gezeigten.
Alter | Geschlecht | Bereich | Zweig | Verkäufe |
---|---|---|---|---|
23 | M | S | 8 | 4 |
45 | M | S | 16 | 4 |
37 | M | S | 8 | 5 |
30 Stunden | M | S | 5 | 7 |
44 | M | N | 4 | 9 |
25 GB | M | N | 2 | 11 |
29 | F | S | 16 | 6 |
41 | F | N | 4 | 8 |
23 | F | N | 6 | 2 |
45 | F | N | 4 | 5 |
33 | F | N | 6 | 10 |
Sie können diese Datensätze mit Sex
und Region
als Schlüsselfelder zusammenfassen. Anschließend können Sie Age
mit dem Modus Mittelwert und Sales
mit dem Modus Summeaggregieren. Wenn Sie die Option Datensatzanzahl einschließen in Feld für den Aggregatknoten auswählen, lautet die aggregierte Ausgabe in etwa wie in der folgenden Tabelle:
Alter (Mittelwert) | Geschlecht | Bereich | Verkäufe (Summe) | Datensatzanzahl |
---|---|---|---|---|
35.5 | F | N | 25 GB | 4 |
29 | F | S | 6 | 1 |
34.5 | M | N | 20 | 2 |
33.75 | M | S | 20 | 4 |
Daraus können Sie beispielsweise entnehmen, dass das Durchschnittsalter der vier weiblichen Angehörigen des Vertriebspersonals in der Region "Nord" 35,5 Jahre beträgt und dass sie insgesamt 25 Einheiten verkauft haben.
Branch
werden automatisch gelöscht, wenn kein Aggregatmodus angegeben ist.