0 / 0
Volver a la versión inglesa de la documentación

Etapa de agregador en DataStage

Última actualización: 12 mar 2025
Etapa Agregador en DataStage

La etapa Agregador clasifica en grupos las filas de datos de un único enlace de entrada y calcula totales u otras funciones agregadas para cada grupo. Los totales sumados para cada grupo se muestran desde la etapa en un enlace de salida.

Cuando efectúa una doble pulsación en la etapa Agregador, se abre el panel de propiedades. El panel de propiedades tiene tres pestañas:

  • Etapa. Siempre está presente y se utiliza para especificar información general sobre la etapa.
  • Entrada. Aquí es donde se especifican los detalles sobre los datos que se agrupan o se agregan.
  • Salida. Aquí es donde se especifican los detalles sobre los grupos que se generan desde la etapa.

Pestaña Entrada

La sección Columnas especifica las definiciones de columna de los datos de entrada. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de entrada.

Pestaña Salida

La etapa Agregador no transfiere datos de entrada, sino que genera nuevas columnas. La etapa Agregador genera campos que admiten nulos, por lo que las columnas que reciben los datos de salida deben admitir nulos.

La sección Columnas especifica las definiciones de columna de los datos de entrada. Pulse Editar en la parte inferior de la sección Columnas para especificar información de correlación. La correlación especifica la relación entre los datos procesados que genera la etapa Agregador y las columnas de salida. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de salida.

La etapa Agregador le proporciona acceso a operaciones de agrupación y resumen. Una de las formas más fáciles de exponer patrones en una colección de registros es agrupar registros con características similares y, a continuación, calcular las estadísticas en todos los registros del grupo. A continuación, puede utilizar estas estadísticas para comparar las propiedades de los diferentes grupos. Por ejemplo, los registros que contienen transacciones de caja se pueden agrupar por el día de la semana para ver en qué día hubo el mayor número de transacciones, la mayor cantidad de ingresos, etc.

Los registros se pueden agrupar por una o más características, donde las características de registro corresponden a los valores de columna. En otras palabras, un grupo es un conjunto de registros con el mismo valor para una o más columnas. Por ejemplo, los registros de transacciones se pueden agrupar por día de la semana y por mes. Estas agrupaciones pueden mostrar que el día más ocupado de la semana varía según la estación.

Además de revelar patrones en sus datos, la agrupación también puede reducir el volumen de datos resumiendo los registros de cada grupo, lo que facilita su gestión. Si agrupa un gran volumen de datos basándose en una o más características de los datos, el conjunto de datos resultante es generalmente mucho más pequeño que el original y, por lo tanto, es más fácil de analizar utilizando herramientas estándar.

Es importante considerar si debe utilizar las etapas Clasificar o las etapas Agregador adicionales en el trabajo a medida que crea la nueva etapa.

Para ejecutar correctamente un trabajo con la etapa Aggregator, asegúrese de que cada columna de entrada esté correlacionada con una columna de salida del tipo correcto. Las columnas de entrada con un valor Nullable de Sí o No deben correlacionarse con columnas de salida con el mismo valor.

Vea el siguiente vídeo para ver un ejemplo de cómo trabajar con la etapa DataStage® Aggregator.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.