Étape du filtre Bloom dans DataStage
Utilisez l'étape Bloom Filter pour effectuer des recherches efficaces sur les clés.
Vous pouvez utiliser l'étape Bloom Filter pour rechercher plus efficacement les clés entrantes par rapport aux valeurs précédentes. L'étape Bloom Filter peut générer des faux positifs mais ne génère jamais de faux négatifs dans votre fichier de sortie. Vous devez utiliser l'étape Bloom Filter uniquement lorsqu'un petit nombre de faux positifs est acceptable dans votre jeu de données de sortie. Cette étape prend un ensemble de données d'entrée unique et peut générer plusieurs ensembles de sortie en fonction du mode d'exploitation. L'étape Bloom Filter gère les ensembles de fichiers de filtre bloom. Elle ajoute ou supprime également des fichiers du jeu de fichiers en fonction des options spécifiées pour l'étape.
Onglet Entrée
La section Colonnes indique les définitions de colonne des données entrantes. La section Avancé vous permet de modifier les paramètres de mise en mémoire tampon par défaut pour le lien d'entrée.
Onglet Sortie
L'étape peut avoir un nombre quelconque de liens de sortie. Choisissez celui que vous souhaitez utiliser dans la liste déroulante. La section Colonnes indique les définitions de colonne des données entrantes. Cliquez sur Éditer au bas de la section Colonnes pour spécifier les informations de mappage. Le mappage indique la relation entre les données traitées générées par l'étape de filtre de Bloom et les colonnes Sortie. La section Avancé vous permet de modifier les paramètres de mise en mémoire tampon par défaut pour le lien de sortie.