0 / 0
Torna alla versione inglese della documentazione

Combinare lo stadio dei record (DataStage)

Ultimo aggiornamento: 12 mar 2025
Stage Combina record in DataStage

Lo stage Combina record è uno stage di ristrutturazione. Questo stage combina i record (ossia, le righe), in cui i valori delle colonne chiave sono identici, in vettori di sottorecord.

Lo stage Combina record può avere un singolo link di input e un singolo link di output.

Lo stage Combina record combina i record (ovvero, le righe), in cui i valori delle colonne chiave sono identici, in vettori di record secondari. Come input, lo stage utilizza un dataset in cui una o più colonne vengono scelte come chiavi. Tutti i record adiacenti le cui colonne chiave contengono lo stesso valore vengono raccolti nello stesso record sotto forma di record secondari.
Mostra le colonne combinate in un vettore di record secondari

L'input del dataset per lo stage Combine Records deve essere partizionato e ordinato in modo da garantire che le righe con gli stessi valori della colonna chiave si trovino nella stessa partizione e vengano elaborate dallo stesso nodo. La scelta del metodo di partizionamento (automatico) assicura che il partizionamento e l'ordinamento vengano eseguiti. Se l'ordinamento e il partizionamento vengono eseguiti su stage separati prima dello stage Combine Records, DataStage® in modalità automatica lo rileverà e non ripartirà (in alternativa, è possibile specificare esplicitamente lo stesso metodo di partizionamento).

L'editor Stage contiene tre schede:

  • Scheda Stage. Questa scheda è sempre presente e viene utilizzata per specificare informazioni generali sullo stage.
  • Scheda Input. Questa scheda è il punto in cui si specificano i dettagli relativi alla singola serie di input da cui si stanno selezionando i record.
  • Scheda Output. Questa scheda è dove si specificano i dettagli sui dati elaborati che vengono emessi dallo stage.

Scheda input

Specificare una descrizione opzionale del collegamento di input nella sezione Descrizione. Nella sezione Partizioni, specificare come vengono partizionati i dati in entrata prima della loro conversione. Nella sezione Colonne, specificare le definizioni delle colonne dei dati in entrata. Nella sezione Avanzate è possibile modificare le impostazioni di buffering predefinite per il collegamento di ingresso.

Scheda output

Nella scheda Output è possibile specificare i dettagli dei dati in uscita dallo stage Combina record. Lo stadio Combine Records può avere un solo collegamento di uscita.

Specificare una descrizione opzionale del collegamento di input nella sezione Descrizione. Nella sezione Partizioni, specificare come vengono partizionati i dati in entrata prima della loro conversione. Nella sezione Colonne, specificare le definizioni delle colonne dei dati in entrata. Nella sezione Avanzate è possibile modificare le impostazioni di buffering predefinite per il collegamento di ingresso.

Specificare una descrizione opzionale del collegamento di input nella sezione Descrizione. La sezione Colonne specifica le definizioni delle colonne dei dati. Utilizzare la sezione Avanzate per modificare le impostazioni di buffering predefinite per il collegamento di uscita.