0 / 0
Torna alla versione inglese della documentazione

Modificare la fase di cattura in DataStage

Ultimo aggiornamento: 12 mar 2025
Stage Change Capture in DataStage

Lo stage Change Capture è uno stage di elaborazione che confronta due dataset e crea un record delle differenze.

Lo stage Change Capture utilizza due dataset di input, indicati prima e dopo, ed emette un singolo dataset i cui record rappresentano le modifiche apportate al dataset precedente per ottenere il dataset successivo. Lo stage produce un dataset di modifica, la cui definizione di tabella viene trasferita dalla definizione di tabella del dataset successivo con l'aggiunta di una colonna: un codice di modifica con valori che codificano le quattro azioni: inserimento, eliminazione, copia e modifica. L'indicatore di conservazione della partizione è impostato sulla serie di dati di modifica.

Il confronto si basa su una serie di colonne chiave, le righe dei due dataset vengono considerate copie l'una dell'altra se hanno gli stessi valori in queste colonne chiave. È anche possibile specificare facoltativamente i valori di modifica. Se due righe hanno colonne chiave identiche, è possibile confrontare le colonne valore nelle righe per vedere se una è una copia modificata dell'altra.

Lo stage presuppone che i dati in entrata siano partizionati in base alla chiave e ordinati in ordine crescente. Le colonne su cui viene eseguito l'hash dei dati devono essere le colonne chiave utilizzate per il confronto dei dati. È possibile ottenere l'ordinamento e il partizionamento utilizzando lo stage Sort o utilizzando le funzioni di ordinamento e partizionamento integrate dello stage Change Capture.

È possibile utilizzare lo stage Change Apply per combinare le modifiche apportate dallo stage Change Capture con il set di dati originale precedente per riprodurre il set di dati successivo (vedere Switch stage in DataStage).

La fase di Acquisizione delle modifiche è molto simile alla fase di Differenza descritta in Fase di Differenza in DataStage.

Quando si fa doppio clic sullo stage, viene visualizzato il riquadro delle proprietà. Il pannello delle proprietà contiene tre schede:

  • Fase. È sempre presente e viene utilizzato per specificare informazioni generali sullo stage.
  • Ingresso. Questo è il punto in cui si specificano i dettagli relativi al dataset per il quale vengono rimossi i relativi duplicati.
  • Uscita. Qui è dove si specificano i dettagli sui dati elaborati che vengono emessi dallo stage.

Scheda input

La scheda Colonne specifica le definizioni delle colonne dei dati in entrata. La scheda Avanzate consente di modificare le impostazioni di buffering predefinite per il collegamento di ingresso.

Scheda output

La sezione Colonne specifica le definizioni delle colonne dei dati. Fare clic su Modifica nella sezione colonne per aprire l'editor delle colonne. La sezione Mappe dalla colonna di input consente di specificare la relazione tra le colonne immesse nello stage Change Capture e le colonne di output. La scheda Avanzate consente di modificare le impostazioni di buffering predefinite per il collegamento di uscita.