0 / 0
Volver a la versión inglesa de la documentación

Etapa Distributed Transaction en DataStage

Última actualización: 12 mar 2025
Etapa Distributed Transaction en DataStage

Utilice la etapa Transacción distribuida para ejecutar transacciones que abarquen varias fuentes de datos, gestionadas por IBM® MQ o Apache Kafka. Puede utilizar IBM Db2 para DataStage, Oracle Database para DataStage, ODBC, IBM MQ, o Teradata como conectores de entrada.

Visión general

Una transacción es una serie de acciones que se completan como una sola operación. Una transacción finaliza con una acción de confirmación que hace que los cambios sean permanentes. Si alguno de los cambios no se puede confirmar, la transacción retrotrae todos los cambios.

Una transacción distribuida es una transacción que puede abarcar varios orígenes de datos como, por ejemplo, una o varias bases de datos y un gestor de transacciones como, por ejemplo, una cola de mensajes IBM MQ . Para que la transacción se confirme correctamente, todos los orígenes de datos individuales deben confirmarse correctamente. Si algún recurso no puede confirmar, se retrotrae toda la transacción. Por ejemplo, una transacción distribuida puede consistir en una transferencia de dinero entre dos cuentas bancarias que están en bases de datos diferentes. La transacción se confirma sólo si el retiro de una cuenta y el depósito en la otra cuenta se completan correctamente.

La etapa Distributed Transaction sigue el estándar X/Open, que utiliza un modelo de proceso que consta de los componentes siguientes:
  • Programa de aplicación que define límites de transacción y especifica acciones que constituyen una transacción
  • Gestores de recursos, como bases de datos o sistemas de archivos que proporcionan acceso a orígenes de datos compartidos
  • Un gestor de transacciones que asigna identificadores a las transacciones, supervisa su progreso y gestiona la finalización de la transacción y la recuperación de anomalías
Los gestores de recursos soportados incluyen IBM Db2 para DataStage y Oracle Database para DataStage. Los gestores de transacciones soportados incluyen IBM MQ y Apache Kafka.

En un ejemplo de un diseño típico para un flujo de transacciones distribuidas, un conector IBM MQ consume mensajes de origen de una cola de mensajes y mueve los mensajes a una cola de trabajos persistente. El conector copia los datos, el ID de mensaje y otros campos de cabecera de mensaje del origen al mensaje de destino. El conector también envía los datos de mensaje a un enlace de salida. Una o más etapas procesan los datos de mensaje y datos adicionales de un conector de Oracle Database para DataStage y envían los datos procesados a la etapa Distributed Transaction a través de uno o más enlaces. Cada enlace de entrada a la etapa representa la salida a una base de datos de destino. Los enlaces proporcionan el ID de mensaje del mensaje de origen original, que se consume de la cola de trabajos como parte de la transacción distribuida.

Pestaña Entrada

Configure las propiedades del conector para cada enlace de entrada. Seleccione un origen de datos y especifique las propiedades de conexión asociadas. Seleccione el método de escritura que está utilizando para escribir datos en un destino y especifique las propiedades que son necesarias para dicho método de escritura y destino.

Pestaña Etapa

Especifique un gestor de transacciones y una conexión. Seleccione si desea habilitar las transacciones globales y la mensajería de IBM MQ . Especifique una cola de trabajos a la que mover los mensajes. Puede seleccionar si desea rechazar las unidades anómalas, lo que retrotrae las transacciones que incluyen registros anómalos. Puede especificar una cola de rechazados para almacenar registros anómalos y establecer otras propiedades de rechazo. Puede especificar el orden en el que se deben procesar los enlaces de entrada. También puede configurar la ordenación de registros para controlar el orden del proceso de registros independientemente del enlace en el que se encuentren los registros.