Etapes DataStage
Un flux DataStage® se compose d'étapes liées entre elles, qui décrivent le flux de données d'une source de données vers une cible de données. Une étape décrit une source de données, une étape de traitement ou un système cible. L'étape définit également la logique de traitement qui déplace les données des liens d'entrée vers les liens de sortie.
Fonctions d'une étape
Une étape possède généralement au moins une entrée de données ou une sortie de données. Cependant, certaines étapes peuvent accepter plus d'une entrée de données, et la sortie vers plusieurs étapes. Le tableau suivant répertorie les étapes disponibles et fournit des détails sur leurs fonctions:
Etape | Icône | Fonction |
---|---|---|
Aggregator | Classe les données entrantes en groupes, calcule les valeurs totales, exécutent d'autres fonctions récapitulatives pour chaque groupe et les transmet à une autre étape du travail. | |
Bloom Filter | Recherche les clés entrantes par rapport aux valeurs précédentes. | |
Change Apply | Applique les opérations de modification codées à un ensemble de données avant basé sur un ensemble de données modifié. Les ensembles de données avant et après proviennent de l'étape Change Capture. | |
Change Capture | Compare deux ensembles de données et enregistre les différences. | |
Checksum | Génère une valeur de total de contrôle à partir des colonnes spécifiées d'une ligne et ajoute le total de contrôle à la ligne. | |
Column Export | Exporte les données d'un certain nombre de colonnes de types de données différents vers une seule colonne de types de données ustring, string ou binary. | |
Column Generator | Ajoute des colonnes aux données entrantes et génère des données fictives de ces colonnes pour chaque ligne de données traitée. | |
Column Import | Importe les données d'une même colonne et les transmet en sortie à une ou plusieurs colonnes. | |
Combine Records | Combine les enregistrements dont les valeurs clé-colonne particulières sont identiques dans des vecteurs de sous-enregistrements. | |
Compare | Effectue une comparaison colonne par colonne des enregistrements dans deux jeux de données d'entrée prétriés. | |
Compress | Utilise l'utilitaire UNIX compress ou GZIP pour compresser un fichier. Elle convertit un jeu de données contenant une série d'enregistrements en flux de données binaires brutes. | |
Copy | Copie un ensemble de données d'entrée vers un certain nombre d'ensembles de données de sortie. | |
Decode | Décode un ensemble de données à l'aide d'une commande de décodage UNIX que vous fournissez. | |
Difference | Effectue une comparaison enregistrement par enregistrement de deux ensembles de données d'entrée, qui correspondent à des versions différentes du même ensemble de données. | |
Distributed Transaction | Exécute des transactions sur plusieurs sources de données. | |
Encode | Code un jeu de données à l'aide d'une commande de codage UNIX que vous fournissez. | |
Expand | Exécute l'utilitaire uncompress ou GZIP UNIX pour décompresser un ensemble de données. Elle convertit un jeu de données précédemment compressé en série d'enregistrements à partir d'un flux de données binaire brutes. | |
External Filter | Permet d'indiquer une commande UNIX conçue pour filtrer les données que vous traitez. | |
Filter | Transfère, sans modification, les enregistrements du fichier d'entrée qui répondent aux exigences que vous définissez et supprime tous les autres enregistrements. | |
Funnel | Copie plusieurs ensembles de données d'entrée vers un ensemble de données de sortie unique. | |
Generic | Incorpore un opérateur Orchestrate ® dans votre travail. | |
Head | Sélectionne les premiers enregistrements N de chaque partition d'un fichier d'entrée et copie les enregistrements sélectionnés dans un jeu de données de sortie. | |
Join | Effectue des opérations de jointure sur plusieurs ensembles de données de l'étape, puis transmet l'ensemble de données obtenu. | |
Lookup | Effectue des opérations de consultation dans un ensemble de données lu en mémoire dans une autre étape d'un travail parallèle qui peut générer les données, ou sur un ensemble de données fourni par l'une des étapes de base de données qui prend en charge les liens de sortie de référence. Elle peut également effectuer une recherche sur une table de recherche contenue dans une étape de recherche d'ensemble de fichiers. | |
Make Subrecords | Associe des vecteurs spécifiés dans un jeu de données d'entrée dans un vecteur de sous-enregistrements dont les colonnes possèdent les noms et les types de données des vecteurs d'origine. | |
Make Vector | Combine les colonnes spécifiées d'un enregistrement de données d'entrée dans un vecteur de colonnes. | |
Merge | Combine un ensemble de données maître trié à un ou plusieurs ensembles de données de mise à jour triés. | |
Modify | Modifie le schéma d'enregistrement de son ensemble de données d'entrée. | |
Peek | Imprime les valeurs de colonne d'enregistrement dans l'historique des travaux ou dans un lien de sortie distinct lorsque l'étape copie les enregistrements de son ensemble de données d'entrée vers un ou plusieurs ensembles de données de sortie. | |
Pivot Enterprise | L'étape Pivot Enterprise est une étape de traitement qui pivote les données horizontalement et verticalement. Le pivotant horizontal mappe un ensemble de colonnes d'une ligne d'entrée à une seule colonne dans plusieurs lignes de sortie. Le pivotant vertical mappe un ensemble de lignes dans les données d'entrée à des colonnes de sortie uniques ou multiples. |
|
Promote Subrecords | Promeut les colonnes d'un sous-enregistrement d'entrée vers des colonnes de niveau supérieur. | |
Remove Duplicates | Utilise un ensemble de données trié en entrée, supprime tous les enregistrements en double et place les résultats dans un ensemble de données de sortie. | |
Row Generator | Génère un ensemble de données fictives correspondant aux métadonnées indiquées. | |
Sample | Génère des échantillons dans un ensemble de données d'entrée. | |
Slowly Changing Dimension (SCD) | Fonctionne dans le contexte d'une base de données à schéma en étoile pour stocker et gérer les données actuelles et historiques dans le temps. | |
Sort | Trie les colonnes d'entrée. | |
Split Subrecord | Sépare une zone de sous-enregistrement d'entrée en un ensemble de colonnes de vecteur de niveau supérieur. | |
Split Vector | Promeut les éléments d'un vecteur de longueur fixe vers un ensemble de colonnes portant le même nom. | |
Surrogate Key Generator stage | Génère des colonnes de clé de substitution et gère la source de clé. | |
Switch | Utilise un ensemble de données unique comme entrée et affecte chaque enregistrement d'entrée à un ensemble de données de sortie en fonction de la valeur de la zone de sélecteur. | |
Tail | Sélectionne les derniers enregistrements N de chaque partition d'un jeu de données d'entrée et copie les enregistrements sélectionnés dans un fichier de sortie. | |
Transformer | Gère les données extraites, effectue les conversions requises et transmet les données à une autre étape active ou à une étape qui écrit des données dans une base de données ou un fichier cible. | |
Wave Generator | Surveille un flux de données et insère des marqueurs de fin d'onde au besoin. | |
Web Service | Accède à des opérations de service Web dans un flux ou un travail DataStage . | |
Write Range Map | Ecrit les données dans une carte de localisation. L'étape peut comporter un seul lien d'entrée. |
Regardez cette série de vidéos pour voir comment utiliser les étapes les plus courantes.