0 / 0
Retourner à la version anglaise de la documentation

Étape du filtre externe : Onglet Étape (DataStage)

Dernière mise à jour : 12 mars 2025
Etape External Filter: onglet Etape (DataStage)

L'onglet Étape de l'étape External Filter permet de contrôler les aspects de l'étape External Filter.

La section Propriétés de l'onglet Étape permet de spécifier ce que fait l'étape. La section Avancé vous permet de spécifier le mode d'exécution de l'étape.

Propriétés

L'étape External Filter possède les propriétés suivantes :
Tableau 1. Propriétés
Catégorie/Propriété Valeurs Par défaut Obligatoire ? Répétition ? Dépendant de
Options / Filtre, commande chaîne N/A Y N N/A
Options / Arguments chaîne N/A N N N/A

Commande de filtrage

Indique la ligne de commande de filtre à exécuter et toutes les options de ligne de commande requises. Par exemple :


grep
Si vous utilisez la commande grep dans l'étape External Filter, les espaces de début et de fin contenus dans les données de colonne ne sont pas envoyés à la sortie de l'étape. Pour éviter ce comportement, utilisez une étape Wrapped. Cet exemple utilise une virgule (,) pour délimiter les zones :
#!/bin/sh
# ------------------------------------------------------------
# mygrep.op  --  'wrapped grep' example
# ------------------------------------------------------------
#
cat <<END
{
wrapped, kind = parallel,
command = "grep 'abc'",
port = { input  = 0, fd = 0, schema = "record{delim=','}()" },
port = { output = 0, fd = 1, schema = "record{delim=','}()" },
usage = "mygrep"
}
END
# ------------------------------------------------------------
# End of wrapper
# ------------------------------------------------------------

Arguments

Permet d'indiquer les arguments requis par la ligne de commande. Par exemple :


\(cancel\).*\1

Avec la commande grep , tous les enregistrements contenant la chaîne "cancel" sont extraits deux fois et les autres enregistrements sont annulés.

Avancé

Cette section vous permet de spécifier les éléments suivants :

  • Mode d'exécution. L'étape peut s'exécuter en mode parallèle ou séquentiel. En mode parallèle, les données d'entrée sont traitées par les nœuds disponibles comme indiqué dans le fichier de configuration et par toutes les contraintes de nœud spécifiées dans la section Avancé. En mode séquentiel, l'ensemble des données est traité par le nœud de conducteur.
  • Mode de combinaison. Il s'agit de l'option Auto par défaut, qui permet à IBM® DataStage® de combiner les opérateurs qui sous-tendent les étapes parallèles afin qu'elles s'exécutent dans le même processus s'il est approprié pour ce type d'étape.
  • Préserver le partitionnement. Il s'agit de Défini par défaut. Vous pouvez sélectionner explicitement Définir ou Effacer. Sélectionnez Définir pour demander que l'étape suivante tente de gérer le partitionnement.