0 / 0
Volver a la versión inglesa de la documentación

Unirse a la etapa en DataStage

Última actualización: 12 mar 2025
Etapa Unión en DataStage

La etapa Unión realiza operaciones de unión en dos o más conjuntos de datos de entrada en la etapa y, a continuación, genera el conjunto de datos resultante.

La etapa Unión es una etapa de proceso. Realiza operaciones de unión en dos o más conjuntos de datos de entrada en la etapa y, a continuación, genera el conjunto de datos resultante. La etapa Unión es una de las tres etapas que unen tablas basándose en los valores de las columnas de clave. Las otras dos son:

Las tres etapas difieren principalmente en la memoria que utilizan, el tratamiento de filas con claves no coincidentes y en sus requisitos de entrada de datos (por ejemplo, si está ordenada). Consulte "Unión en relación con Búsqueda" para obtener ayuda sobre cómo decidir la etapa que se ha de utilizar.

En la etapa Unión, los conjuntos de datos de entrada se identifican de forma teórica como el conjunto "derecho" y el conjunto "izquierdo" y los conjuntos "intermedios". Puede especificar cuál es cuál. Tiene cualquier número de enlaces de entrada y un único enlace de salida.

La etapa puede realizar cuatro operaciones de unión:

  • Interna transfiere registros de conjuntos de datos de entrada cuyas columnas de clave contienen valores iguales al conjunto de datos de salida. Los registros cuyas columnas de clave no contienen valores iguales se descartan. La etapa no se compilará si intenta propagar columnas con el mismo nombre desde distintos enlaces de entrada de una unión interna. Puede colocar una etapa Modify o Transformer delante de la etapa Join para cambiar el nombre de las columnas. También puede conmutar a una unión externa completa.
  • Externa izquierda transfiere todos los valores del conjunto de datos de la izquierda, pero solo transfiere valores desde el conjunto de datos de la derecha y los conjuntos de datos intermedios cuando coinciden las columnas de clave. La etapa descarta la columna de clave de los conjuntos de datos de la derecha e intermedios.
  • Externa derecha transfiere todos los valores del conjunto de datos de la derecha, pero solo transfiere valores del conjunto de datos de la izquierda y los conjuntos de datos intermedios cuando coinciden las columnas de clave. La etapa descarta la columna de clave de los conjuntos de datos de la izquierda e intermedios.
  • Externa completa transfiere los registros en los que el contenido de las columnas de clave es igual en los conjuntos de datos de entrada de izquierda y derecha al conjunto de datos de salida. También transfiere los registros cuyas columnas de clave contienen valores desiguales de ambos conjuntos de datos de entrada al conjunto de datos de salida. (Las uniones externas completas no dan soporte a más de dos enlaces de entrada).
Los requisitos para los datos de entrada son los siguientes:
  • Los metadatos de las columnas en los enlaces de entrada deben coincidir con los valores de la tabla de base de datos.
  • Los conjuntos de datos de entrada en la etapa Unión deben estar particionados por clave y clasificados en orden ascendente. Esto garantiza que las filas con los mismos valores de columna de clave estén en la misma partición y las procese el mismo nodo. También minimiza los requisitos de memoria porque es necesario que haya menos filas en la memoria al mismo tiempo. La elección del método de particionamiento automático garantiza que se realicen el particionamiento y la ordenación. Si la ordenación y el particionamiento se llevan a cabo en etapas separadas antes de la etapa Unión, IBM® DataStage® en modalidad automática detectará esto y no reparticionará (de forma alternativa, podría especificar explícitamente el método de particionamiento Igual).

El editor de etapas de Unión tiene tres páginas:

  • Etapa. Siempre está presente y se utiliza para especificar información general sobre la etapa.
  • Entrada. Aquí es donde se especifican los detalles sobre los conjuntos de datos que se están uniendo.
  • Salida. Aquí es donde se especifican los detalles sobre los datos unidos que se están generando desde la etapa.

Vea el siguiente vídeo para ver un ejemplo de cómo trabajar con la etapa Join de DataStage .

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Pestaña Entrada

La sección Columnas especifica las definiciones de columna de los datos de entrada. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados para el enlace de entrada.

Pestaña Salida

La etapa Unión sólo puede tener un enlace de salida.

La sección Columnas especifica las definiciones de columna de los datos. La sección de columna Correlaciones de entrada de columna que aparece al pulsar Editar en la sección de columnas permite especificar la relación entre las columnas que se generan en la etapa Unión y las columnas de salida. La sección Avanzado permite cambiar los valores de almacenamiento intermedio predeterminados de los enlaces de salida.