Stage Distributed Transaction in DataStage
Utilizzate lo stage Transazioni distribuite per eseguire transazioni che si estendono su più fonti di dati, gestite da IBM® MQ o Apache Kafka. È possibile utilizzare IBM Db2 per DataStage, Oracle Database per DataStage, ODBC, IBM MQ, o Teradata come connettori di ingresso.
Panoramica
Una transazione è una serie di azioni completate come una singola operazione. Una transazione termina con un'azione di commit che rende le modifiche permanenti. Se una delle modifiche non può essere sottoposta a commit, la transazione esegue il rollback di tutte le modifiche.
Una transazione distribuita è una transazione che può estendersi a più origini dati, come uno o più database e un gestore transazioni, come una coda messaggi IBM MQ . Per eseguire correttamente il commit della transazione, tutte le singole origini dati devono eseguire correttamente il commit. Se una risorsa non può eseguire il commit, viene eseguito il rollback dell'intera transazione. Ad esempio, una transazione distribuita potrebbe consistere in un trasferimento di denaro tra due conti bancari che si trovano su database differenti. La transazione viene eseguita solo se il prelievo da un conto e il deposito nell'altro conto sono stati completati correttamente.
- Un programma applicativo che definisce i limiti della transazione e specifica le azioni che costituiscono una transazione
- Gestori risorse, come database o file system che forniscono l'accesso alle origini dati condivise
- Un gestore transazioni che assegna identificativi alle transazioni, ne monitora l'avanzamento e gestisce il completamento della transazione e il recupero da errore
In un esempio di progettazione tipica per un flusso di transazioni distribuito, il connettore IBM MQ utilizza i messaggi di origine da una coda di messaggi e sposta i messaggi in una coda di lavoro persistente. Il connettore copia i dati, l'ID messaggio e altri campi di intestazione del messaggio dall'origine al messaggio di destinazione. Il connettore invia inoltre i dati del messaggio a un collegamento di output. Uno o più stage elaborano i dati del messaggio e i dati aggiuntivi da un connettore Oracle Database per DataStage e inviano i dati elaborati allo stage Distributed Transaction su uno o più link. Ogni link di input allo stage rappresenta un output in un database di destinazione. I link forniscono l'ID del messaggio di origine originale, utilizzato dalla coda di lavoro come parte della transazione distribuita.
Scheda input
Configurare le proprietà del connettore per ogni link di input. Selezionare un'origine dati e specificare le proprietà di connessione associate. Selezionare il metodo di scrittura che si sta utilizzando per scrivere i dati in una destinazione e specificare le proprietà richieste da tale metodo di scrittura e destinazione.
Scheda fase
Specificare un gestore transazioni e una connessione. Selezionare se abilitare le transazioni globali e la messaggistica IBM MQ . Specificare una coda di lavoro in cui spostare i messaggi. È possibile scegliere se rifiutare le unità malfunzionanti, che eseguono il rollback delle transazioni che includono i record non riusciti. È possibile specificare una coda di elementi respinti per memorizzare i record non riusciti e impostare altre proprietà di elementi respinti. È possibile specificare l'ordine in cui elaborare i collegamenti di input. È inoltre possibile impostare l'ordinamento dei record per controllare l'ordine di elaborazione dei record indipendentemente dal collegamento in cui si trovano i record.