Stadio filtro esterno (DataStage)
Lo stage External Filter consente di specificare un comando UNIX che agisce come filtro sui dati che si stanno elaborando.
Lo stage External Filter è uno stage di elaborazione. Può avere un singolo link di input e un singolo link di output. Ad esempio, è possibile utilizzare lo stage per grep un dataset per una determinata stringa o modello ed eliminare i record che non contengono una corrispondenza. Questa tecnica può essere utilizzata per filtrare rapidamente i dati.
Gli spazi vuoti vengono rimossi dall'inizio e dalla fine dei dati prima dell'esecuzione del comando. Per evitare questo comportamento, utilizzare un comando con wrapping esplicito che imposta le opzioni di formato sullo schema.
L'editor Stage contiene tre schede:
- Fase . Utilizzare questa scheda per specificare le informazioni generali sullo stage.
- Ingresso. Utilizzare questa scheda per specificare i dettagli sul link di input che contiene i dati da filtrare.
- Uscita. Utilizzare questa scheda per specificare i dettagli sui dati filtrati che vengono emessi dallo stage.
Scheda input
La sezione Colonne specifica le definizioni delle colonne dei dati in entrata. La sezione Avanzate consente di modificare le impostazioni di buffering predefinite per il collegamento di ingresso.
Scheda output
La scheda Output consente di specificare i dettagli dei dati in uscita dallo stadio Filtro esterno. Lo stadio può avere un solo collegamento di uscita.
Fare clic su Modifica nella sezione Colonne per specificare le definizioni delle colonne dei dati. La sezione Avanzate consente di modificare le impostazioni di buffering predefinite per il collegamento di uscita.