Fase del filtro Bloom in DataStage
Utilizzare lo stage Bloom Filter per eseguire ricerche efficienti sulle chiavi.
È possibile utilizzare lo stage Bloom Filter per ricercare in modo più efficiente le chiavi in entrata rispetto ai valori precedenti. Lo stage Bloom Filter può generare falsi positivi, ma non genera mai falsi negativi nel dataset di output. Si consiglia di utilizzare lo stage Bloom Filter solo quando un numero ridotto di falsi positivi è accettabile nel dataset di output. Questo stage utilizza un singolo data set di input e può generare più set di output a seconda della modalità operativa. Lo stage Bloom Filter gestisce i file set di filtri bloom. Inoltre, aggiunge o elimina i file dalla serie di file in base alle opzioni specificate per lo stage.
Scheda input
La sezione Colonne specifica le definizioni delle colonne dei dati in entrata. La sezione Avanzate consente di modificare le impostazioni di buffering predefinite per il collegamento di ingresso.
Scheda output
Lo stadio può avere un numero qualsiasi di collegamenti di uscita. Scegliere quello su cui lavorare dall'elenco a discesa. La sezione Colonne specifica le definizioni delle colonne dei dati in entrata. Fare clic su Modifica in fondo alla sezione Colonne per specificare le informazioni di mappatura. La mappatura specifica la relazione tra i dati elaborati prodotti dalla fase del filtro Bloom e le colonne di output. La sezione Avanzate consente di modificare le impostazioni di buffering predefinite per il collegamento di uscita.