0 / 0
Volver a la versión inglesa de la documentación

Etapa de diferencia en DataStage

Última actualización: 12 mar 2025
Etapa Diferencia en DataStage

La etapa Diferencia realiza una comparación registro a registro de dos conjuntos de datos de entrada, que son versiones diferentes del mismo conjunto de datos designadas como los conjuntos de datos anterior y posterior.

La etapa Diferencia es una etapa de proceso. Genera un único conjunto de datos que incluye los registros que representan la diferencia entre ellos. En la etapa, se presupone que los conjuntos de datos de entrada se han particionado por clave y se han clasificado en orden ascendente en las columnas de clave que especifica para la comparación de la etapa Diferencia. Para ello, utilice la etapa Clasificar o las funciones de clasificación y particionamiento incorporadas de la etapa Diferencia.

La comparación se realiza basándose en un conjunto de columnas de clave de diferencias. Dos registros son copias de otro si tienen el mismo valor para todas las claves de diferencia. Opcionalmente, también puede especificar valores de cambio. Si dos registros tienen columnas de clave idénticas, puede comparar las columnas de valor para ver si una es una copia editada de la otra.

La etapa Diferencia es similar, pero no idéntica, a la etapa Captura de cambios descrita en Etapa Captura de cambios en DataStage. La etapa Change Capture está pensada para utilizarse junto con la etapa Change Apply; genera un conjunto de datos de cambio que contiene los cambios que deben aplicarse al conjunto de datos before para convertirlo en el conjunto de datos after . La etapa Diferencia genera las filas anteriores y posteriores en el conjunto de datos de salida, además de un código que indica si hay diferencias. Si los datos anteriores y posteriores tienen los mismos nombres de columna, un conjunto de datos sobrescribe de forma efectiva al otro conjunto de datos y, por lo tanto, solo verá un conjunto de columnas en la salida. El conjunto de datos que se genera se controla mediante los valores de la sección Orden de enlaces de la pestaña Etapa. Si los conjuntos de datos anterior y posterior tienen nombres de columna diferentes, las columnas de ambos conjuntos de datos están disponibles para generarse según se establece en las opciones de correlación al editar columnas en la pestaña Salida. Las columnas que se designan como columnas de clave o valor en los conjuntos de datos de entrada deben tener los mismos nombres.

Cuando efectúa una doble pulsación en la etapa Diferencia, se abre el panel de propiedades. El panel de propiedades tiene tres pestañas:

  • Etapa. Siempre está presente y se utiliza para especificar información general sobre la etapa.
  • Entrada. Aquí es donde se especifican los detalles sobre los datos que se agrupan o se agregan.
  • Salida. Aquí es donde se especifican los detalles sobre los grupos que se generan desde la etapa.

Pestaña Entrada

La pestaña Columnas especifica las definiciones de columna de los datos de entrada. La pestaña Avanzado le permite cambiar los valores predeterminados del almacenamiento intermedio para el enlace de entrada.

Pestaña Salida

La etapa Diferencia solo puede tener un enlace de salida.

El separador Columnas especifica las definiciones de columna de los datos. Pulse Editar en la parte inferior de la sección Columnas para especificar la relación entre las columnas de entrada en la etapa Diferencia y las columnas de salida. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de salida.