La agregación es una tarea de preparación de datos que se usa con frecuencia para reducir el tamaño de un conjunto de datos. Antes de comenzar a añadir elementos, debe dedicar un tiempo a limpiar los datos, concentrándose especialmente en los valores perdidos. Se puede perder una agregación, información potencialmente útil relacionada con los valores perdidos.
El nodo Agregar se puede usar para reemplazar una secuencia de registros de entrada con registros de salida agregados de resumen. Por ejemplo, podría tener un conjunto de registros de entradas de ventas como el que se muestra en la tabla siguiente:
Edad | Sexo | Región | Rama | Ventas |
---|---|---|---|---|
23 | M | S | 8 | 4 |
45 | M | S | 16 | 4 |
37 | M | S | 8 | 5 |
30 | M | S | 5 | 7 |
44 | M | N | 4 | 9 |
25 | M | N | 2 | 5 |
29 | F | S | 16 | 6 |
41 | F | N | 4 | 8 |
23 | F | N | 6 | 2 |
45 | F | N | 4 | 5 |
33 | F | N | 6 | 10 |
Puede agregar estos registros con Sex
y Region
como campos clave. A continuación, elija agregar Age
con la modalidad Media y Sales
con la modalidad Suma. Seleccione la opción de nodo de agregado Incluir recuento de registros en el campo y la salida agregada será similar a la tabla siguiente.
Edad (media) | Sexo | Región | Ventas (suma) | Recuento de registros |
---|---|---|---|---|
35.5 | F | N | 25 | 4 |
29 | F | S | 6 | 1 |
34.5 | M | N | 20 | 2 |
33.75 | M | S | 20 | 4 |
Del ejemplo se entiende, por ejemplo, que la edad media de las cuatro mujeres del personal de ventas en la región norte es de 35,5, y que la suma de sus ventas totales es de 25 unidades.
Branch
se descartan automáticamente cuando no se especifica ninguna modalidad de agregación.