0 / 0
Volver a la versión inglesa de la documentación

Cambiar etapa de captura en DataStage

Última actualización: 12 mar 2025
Etapa Capturar cambio en DataStage

La etapa Capturar cambio es una etapa de proceso que compara dos conjuntos de datos y crea un registro de las diferencias.

La etapa Capturar cambio utiliza dos conjuntos de datos de entrada, denotados como anterior y posterior, y genera un conjunto de datos individual cuyos registros representan los cambios realizados en el conjunto de datos anterior para obtener el conjunto de datos posterior. La etapa genera un conjunto de datos de cambio, cuya definición de tabla se transfiere desde la definición de la tabla del conjunto de datos posterior con la adición de una columna: Un código de cambio con valores que codifican las cuatro acciones: insertar, suprimir, copiar y editar. El distintivo Conservar particionamiento se establece en el conjunto de datos de cambios.

La comparación se basa en un conjunto de columnas de clave. Se presupone que las filas de los dos conjuntos de datos son copias unas de otras si tienen los mismos valores en estas columnas de claves. Opcionalmente, también puede especificar valores de cambio. Si dos filas tienen columnas de clave idénticas, puede comparar las columnas de valor de las filas para ver si una es una copia editada de la otra.

En la etapa, se supone que los datos entrantes están particionados por clave y clasificados en orden ascendente. Las columnas donde se ejecuta hash en los datos deben ser las columnas de clave utilizadas para la comparación de datos. Puede realizar la ordenación y el particionamiento utilizando la etapa de clasificación o utilizando las funciones de clasificación y particionamiento incorporadas de la etapa Capturar cambio.

Puede utilizar la etapa complementaria Aplicar cambio para combinar los cambios de la etapa Capturar cambio con el conjunto de datos original anterior para reproducir el conjunto de datos posterior (véase Etapa de cambio en DataStage).

La etapa Captura de cambios es muy similar a la etapa Diferencia descrita en Etapa Diferencia en DataStage.

Cuando efectúa una doble pulsación en la etapa, se abre el panel de propiedades. El panel de propiedades tiene tres pestañas:

  • Etapa. Siempre está presente y se utiliza para especificar información general sobre la etapa.
  • Entrada. Aquí es donde se especifican los detalles sobre el conjunto de datos cuyos duplicados se van a eliminar.
  • Salida. Aquí se especifican los detalles sobre los datos procesados que son la salida de la etapa.

Pestaña Entrada

La pestaña Columnas especifica las definiciones de columna de los datos de entrada. La pestaña Avanzado le permite cambiar los valores predeterminados del almacenamiento intermedio para el enlace de entrada.

Pestaña Salida

La sección Columnas especifica las definiciones de columna de los datos. Pulse Editar en la sección de columnas para abrir el editor de columnas. La sección Correlaciones de columna de entrada permite especificar la relación entre las columnas de entrada en la etapa Capturar cambio y las columnas de salida. La pestaña Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de salida.