I flussi DataStage® sono gli asset di progettazione che contengono la logica di integrazione dei dati.
È possibile creare un flusso DataStage vuoto e aggiungere connettori e stage oppure è possibile importare un flusso DataStage esistente da un file ISX o ZIP.
- Origini dati che leggono i dati
- Stage che trasformano i dati
- Destinazioni dati che scrivono dati
- Link che collegano origini, stage e destinazioni
I flussi DataStage e i loro oggetti associati sono organizzati in progetti. Per iniziare, aprire un progetto esistente o creare un nuovo progetto.
Creazione di un flusso DataStage
Per creare un flusso DataStage , completare la seguente procedura.
- Aprire un progetto esistente o creare un progetto.
- Nella scheda Attività, fare clic su .
- Nella pagina Crea un flusso DataStage , utilizzare uno dei seguenti due metodi per creare il flusso DataStage :
- Fare clic sulla scheda Nuovo , aggiungere i dettagli necessari per il flusso DataStage , quindi fare clic su Crea. Il nuovo flusso DataStage si apre senza oggetti nell'area di progettazione DataStage .
- Fare clic sulla scheda File locale , quindi caricare un file ISX o ZIP dal computer locale. Quindi, fare clic su Crea. Una volta completato il processo di importazione, chiudere la pagina del report di importazione, quindi aprire il flusso DataStage importato dalla scheda Asset del progetto.
- Trascinare i connettori o gli stage dalla tavolozza nell'area di disegno DataStage come nodi e disporli come si desidera. Collegare questi nodi nell'area di disegno passando il puntatore del mouse su un nodo per visualizzare una freccia sul nodo, quindi fare clic sull'icona della freccia e trascinarla sul nodo a cui si desidera connettersi.
Questa azione crea un link tra i nodi.
Per collegarsi ai dati remoti, vedere Collegamento a un'origine dati in DataStage.
- Fare doppio clic su un nodo per aprirne il pannello delle proprietà, in cui è possibile specificare le configurazioni e le impostazioni per il nodo.
- Fare clic su Esegui una volta terminata l'impostazione del flusso.
Il flusso viene automaticamente salvato, compilato ed eseguito. È possibile visualizzare i log per la compilazione e l'esecuzione del processo.
Modifica di un flusso DataStage
È possibile utilizzare le azioni riportate di seguito per modificare un flusso DataStage .
- Trascinare uno stage o un connettore e rilasciarlo su un link tra due nodi già presenti nell'area di disegno DataStage . I link vengono aggiunti automaticamente per il nuovo nodo e le colonne vengono propagate automaticamente. Fare nuovamente clic su Esegui per visualizzare i risultati.
- Scollegare e ricollegare manualmente i link dai nodi nell'area DataStage posizionando il puntatore su di essi e facendo clic sugli endpoint dei link.
- Trascinare uno stage o un connettore dalla tavolozza e rilasciarlo su un link già presente nell'area. Lo stage o il connettore viene automaticamente collegato al nodo su entrambi i lati e le colonne nel flusso DataStage vengono propagate automaticamente.
- Fare clic sull'icona Sostituisci
e selezionare un altro flusso per sostituirlo. Questa azione è disponibile anche per gli stadi Build, Custom e Wrapped, oltre che per i sottoflussi e le librerie Java.
Anteprima dei dati
È possibile modificare e visualizzare in anteprima i dati nel flusso DataStage. Nell'area di disegno, fare clic con il pulsante destro del mouse sulla connessione e selezionare Anteprima dati. È possibile visualizzare in anteprima i dati con tutte le connessioni e i connettori di file. Per ulteriori informazioni sui connettori di file, vedere Connettori di file in DataStage.
Ad esempio, è possibile visualizzare l'anteprima dell'ora e dei microsecondi con il fuso orario. Entrambi i tipi di dati " time
e " microseconds time
appaiono nel formato standard: HH:mm:ss
per l'ora e 'HH:mm:ss.SSSSSS
per i microsecondi.
Input time: 00:00:01-10:00
Local Time: 00:00:01
offset: -10 (which means UTC is 10 hours ahead of local time)
UTC Time: LocalTime + Offset = 00:00:01 + 10 hrs = 10:00:01
dove il fuso orario viene convertito e visualizzato come " 10:00:01
nel formato orario standard.Considerazioni
- Informazioni sensibili e valori di proprietà codificati
- Non è consigliabile specificare valori di proprietà codificati come le password nei flussi DataStage . Invece, creare una serie di parametri di tipo Crittografato con un parametro denominato e non specificare un valore predefinito per il parametro. Nel flusso, fare riferimento alla serie di parametri codificata e specificare il parametro denominato per il valore della proprietà, ad esempio:
#<parameter set>.<parameter name>#
. Specificare il valore codificato per il parametro#parameter set.parameter name#
nel job che esegue il flusso. - Denominazione dei file in origini e destinazioni per evitare il danneggiamento dei dati
- Nella maggior parte dei casi, non utilizzare lo stesso nome file nell'origine come nella destinazione se l'origine e la destinazione puntano allo stesso database o sistema di memoria. Questa regola si applica ai file e alle tabelle di database. Se i nomi sono gli stessi, i dati potrebbero essere danneggiati.
- Propagazione delle modifiche ai metadati delle colonne
- Quando si modificano i metadati di una colonna, le modifiche vengono propagate automaticamente a valle. Le modifiche apportate a monte non si applicano a una colonna una volta modificati i metadati. Se si elimina una colonna, la modifica della colonna in una fase successiva non aggiungerà nuovamente la colonna.
- Propagazione colonna di runtime
- Quando RCP è impostato, se il lavoro rileva colonne aggiuntive non definite nei metadati durante l'esecuzione, adotta queste colonne aggiuntive e le propaga attraverso il resto del lavoro. In questo modo si evitano gli errori dovuti alle associazioni mancanti.
- Aggiunta di parametri
- Consultare Aggiunta di parametri.
Ulteriori informazioni
Esempi
- Creazione di un flusso DataStage
Guarda il seguente video per un esempio di come creare un flusso DataStage semplice.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
- Importazione di un flusso DataStage in un progetto
Guarda il seguente video per un esempio di come importare un flusso DataStage in un progetto.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.