Compara la etapa en DataStage
La etapa Compare realiza una comparación columna a columna de los registros en dos conjuntos de datos de entrada preordenados. Puede restringir la comparación a las columnas de clave especificadas.
La etapa Compare es una etapa de proceso. Puede tener dos enlaces de entrada y un solo enlace de salida.
La etapa Compare no cambia la definición de tabla, el particionamiento ni el contenido de los registros en ningún conjunto de datos de entrada. Transfiere ambos conjuntos de datos intactos a un solo conjunto de datos de salida generado por la etapa. Los resultados de la comparación también se registran en el conjunto de datos de salida.
Puede utilizar la propagación de columnas de tiempo de ejecución en esta etapa y permitir que IBM DataStage defina el esquema de columna de salida automáticamente en el tiempo de ejecución. La etapa genera un conjunto de datos con tres columnas:
- resultado. Transporta el código que da el resultado de la comparación.
- primero. Un subregistro que contiene las columnas del primer enlace de entrada.
- segundo. Un subregistro que contiene las columnas del segundo enlace de entrada.
- Especifique la columna padre de los datos de salida correspondientes al primer enlace de entrada y establezca el tipo SQL en desconocido.
- Especifique las columnas reales que transportan los datos y conviértalas en subregistros de la columna padre. Llame a cada columna first.colname, por ejemplo, first.col1, first.col2, y así sucesivamente. Para convertir cada columna en un subregistro, seleccione la columna, seleccione Editar fila en el menú de atajos y especifique un número de nivel (por ejemplo, 03) para esa columna. (Para acelerar este proceso, puede convertir la primera columna en un subregistro y utilizar la característica de propagar valores para convertir el resto de columnas en subregistros de la columna padre).
- Especifique la columna padre de los datos de salida correspondientes al segundo enlace de entrada y establezca el tipo SQL en desconocido.
- Especifique las columnas reales que transportan los datos del segundo enlace de entrada, llámelas second.colname (por ejemplo, second.col1, second.col2) y conviértalas en subregistros de la columna padre.
Cuando efectúa una doble pulsación en la etapa Comparar, se abre el panel de propiedades. El panel de propiedades tiene tres pestañas:
- Etapa. Siempre está presente y se utiliza para especificar información general sobre la etapa.
- Entrada. Aquí es donde se especifican los detalles sobre los datos que se agrupan o se agregan.
- Salida. Aquí es donde se especifican los detalles sobre los grupos que se generan desde la etapa.
Pestaña Entrada
La sección Columnas especifica las definiciones de columna de los datos de entrada. La pestaña Avanzado le permite cambiar los valores predeterminados del almacenamiento intermedio para el enlace de entrada.
Pestaña Salida
La sección Columnas especifica las definiciones de columna de los datos. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de salida.