0 / 0
Volver a la versión inglesa de la documentación

Compara la etapa en DataStage

Última actualización: 12 mar 2025
Etapa Comparar en DataStage

La etapa Compare realiza una comparación columna a columna de los registros en dos conjuntos de datos de entrada preordenados. Puede restringir la comparación a las columnas de clave especificadas.

La etapa Compare es una etapa de proceso. Puede tener dos enlaces de entrada y un solo enlace de salida.

La etapa Compare no cambia la definición de tabla, el particionamiento ni el contenido de los registros en ningún conjunto de datos de entrada. Transfiere ambos conjuntos de datos intactos a un solo conjunto de datos de salida generado por la etapa. Los resultados de la comparación también se registran en el conjunto de datos de salida.

Puede utilizar la propagación de columnas de tiempo de ejecución en esta etapa y permitir que IBM DataStage defina el esquema de columna de salida automáticamente en el tiempo de ejecución. La etapa genera un conjunto de datos con tres columnas:

  • resultado. Transporta el código que da el resultado de la comparación.
  • primero. Un subregistro que contiene las columnas del primer enlace de entrada.
  • segundo. Un subregistro que contiene las columnas del segundo enlace de entrada.
Si especifica manualmente los metadatos del enlace de salida, debe definir las columnas que transportan los datos como subregistros de una columna padre que también debe definir. IBM DataStage no permite especificar dos grupos de nombres de columna idénticos, por lo que debe convertirlos en subregistros para darles nombres exclusivos como first.col1 y secon.col1. Siga estos pasos para especificar los metadatos:
  1. Especifique la columna padre de los datos de salida correspondientes al primer enlace de entrada y establezca el tipo SQL en desconocido.
  2. Especifique las columnas reales que transportan los datos y conviértalas en subregistros de la columna padre. Llame a cada columna first.colname, por ejemplo, first.col1, first.col2, y así sucesivamente. Para convertir cada columna en un subregistro, seleccione la columna, seleccione Editar fila en el menú de atajos y especifique un número de nivel (por ejemplo, 03) para esa columna. (Para acelerar este proceso, puede convertir la primera columna en un subregistro y utilizar la característica de propagar valores para convertir el resto de columnas en subregistros de la columna padre).
  3. Especifique la columna padre de los datos de salida correspondientes al segundo enlace de entrada y establezca el tipo SQL en desconocido.
  4. Especifique las columnas reales que transportan los datos del segundo enlace de entrada, llámelas second.colname (por ejemplo, second.col1, second.col2) y conviértalas en subregistros de la columna padre.

Cuando efectúa una doble pulsación en la etapa Comparar, se abre el panel de propiedades. El panel de propiedades tiene tres pestañas:

  • Etapa. Siempre está presente y se utiliza para especificar información general sobre la etapa.
  • Entrada. Aquí es donde se especifican los detalles sobre los datos que se agrupan o se agregan.
  • Salida. Aquí es donde se especifican los detalles sobre los grupos que se generan desde la etapa.

Pestaña Entrada

La sección Columnas especifica las definiciones de columna de los datos de entrada. La pestaña Avanzado le permite cambiar los valores predeterminados del almacenamiento intermedio para el enlace de entrada.

Pestaña Salida

La sección Columnas especifica las definiciones de columna de los datos. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de salida.