Trichterstufe in DataStage
Die Stage 'Funnel' kopiert mehrere Eingabedatasets in ein einziges Ausgabedataset. Sie können diese Operation verwenden, um getrennte Datasets zu einem einzigen großen Dataset zu kombinieren.
Die Stage 'Funnel' ist eine verarbeitende Stage. Sie kann eine beliebige Anzahl Eingabelinks und einen einzigen Ausgabelink haben.
Die Stage 'Funnel' kann einen von drei Modi anwenden:
- Im Modus Kontinuierlicher Trichter werden die Datensätze der Eingabedaten in keiner garantierten Reihenfolge kombiniert. Bei diesem Modus wird jedem Eingabelink reihum jeweils ein Datensatz entnommen. Wenn in einem Eingabelink keine Daten verfügbar sind, fährt die Stage mit dem nächsten Link fort, ohne zu warten.
- Im Modus Sortiertrichter werden die Eingabedatensätze in der Reihenfolge kombiniert, die durch den bzw. die Wert(e) einer oder mehrerer Schlüsselspalten definiert ist bzw. sind. Die Reihenfolge der Ausgabedatensätze wird durch diese Sortierschlüssel bestimmt.
- Im Modus Sequenz werden alle Datensätze aus dem ersten Eingabedataset in das Ausgabedataset kopiert. Danach werden alle Datensätze aus dem zweiten Eingabedataset kopiert usw.
Für alle Methoden müssen die Metadaten aller Eingabedatasets identisch sein.
Für die Sortiertrichtermethode (Sort Funnel) gelten einige besondere Voraussetzungen für die Eingabedaten. Alle Eingabedatasets müssen nach denselben Schlüsselspalten sortiert sein, um von der Trichteroperation verwendet werden zu können.
Normalerweise erfolgt für alle Eingabedatasets für eine Operation vom Typ 'Sortiertrichter' vor der Sortierung eine Hash-Partitionierung. Die Hashpartitionierung garantiert, dass sich alle Datensätze mit denselben Schlüsselspaltenwerten in derselben Partition befinden und somit auf demselben Knoten verarbeitet werden. Wenn die Sortierung und Partitionierung in separaten Stages vor der Stage 'Funnel' ausgeführt werden, muss diese Partitionierung beibehalten werden.
Mit der Operation Sortiertrichter können Sie einen Primärschlüssel und mehrere Sekundärschlüssel festlegen. In der Stage 'Funnel' wird zunächst der Primärschlüssel in jedem Eingabedatensatz untersucht. Für mehrere Datensätze mit demselben Primärschlüsselwert untersucht sie dann die sekundären Schlüssel, um die Reihenfolge der Datensätze zu bestimmen, die sie ausgibt.
Im Stage-Editor gibt es drei Registerkarten:
- Stage. Diese Seite ist immer vorhanden und wird verwendet, um allgemeine Informationen zur Stage anzugeben.
- Eingabe. Hier geben Sie Details zu den Datasets an, die verknüpft werden.
- Ausgabe. Hier geben Sie Details zu den verknüpften Daten an, die von der Stage ausgegeben werden.
Das folgende Video zeigt ein Beispiel für die Arbeit mit der DataStage® -Stage 'Funnel'.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Registerkarte 'Eingabe'
Der Abschnitt Spalten gibt die Spaltendefinitionen eingehender Daten an. Im Abschnitt Erweitert können Sie die Standardeinstellungen für die Pufferung für den Eingabelink ändern.
Registerkarte 'Ausgabe'
Der Abschnitt Spalten gibt die Spaltendefinitionen der Daten an. Der Abschnitt Zuordnungen aus der Eingabespalte, der angezeigt wird, wenn Sie im Abschnitt 'Spalten' auf Bearbeiten klicken, ermöglicht es Ihnen, die Beziehung zwischen den Spalten anzugeben, die in die Stage 'Funnel' und die Ausgabespalten eingegeben werden. Im Abschnitt Erweitert können Sie die Standardeinstellungen für die Pufferung für die Ausgabelinks ändern.
- Zuordnungsausgabe
In der Dropdown-Liste werden die Ausgabelinks angezeigt. Diese sind schreibgeschützt und können auf dieser Registerkarte nicht geändert werden. Für die Stage 'Funnel' gilt die Anforderung, dass alle Eingabelinks identische Metadaten aufweisen müssen, so dass nur ein Satz von Spaltendefinitionen angezeigt wird.
Der Abschnitt Zuordnungen aus der Eingabespalte, der angezeigt wird, wenn Sie im Abschnitt 'Spalten' auf Bearbeiten klicken, ermöglicht es Ihnen, die Beziehung zwischen den Spalten anzugeben, die in die Stage 'Funnel' und die Ausgabespalten eingegeben werden.