0 / 0
Zurück zur englischen Version der Dokumentation

Schritt XML-Parser (DataStage)

Letzte Aktualisierung: 12. März 2025
Schritt 'XML-Parser' (Stage 'Hierarchical Data')

Verwenden Sie den Schritt 'XML-Parser', um ein oder mehrere Dokumente syntaktisch zu analysieren, die dieselbe Struktur aufweisen.

XML-Quelle

Geben Sie für die Quelle der XML-Daten eine der folgenden Optionen an:
Zeichenfolgegruppe
Wählen Sie das Eingabeschema-Element aus, das die Dokumentzeichenfolge enthält. Nur Elemente, die die Datentypen 'String', 'normalizedString', 'byteString' oder 'XML' haben, stehen zur Auswahl zur Verfügung.
Einzelne Datei
Geben Sie den Pfad und den Dateinamen ein, oder klicken Sie auf Parameter einfügen, und wählen Sie dann den Namen des Parameters aus. Es stehen die Parameter zur Verfügung, die Sie zuvor im Auftrag definiert haben, sowie die integrierten Makros, die in IBM® InfoSphere® DataStage® enthalten sind. Es stehen nur Elemente mit den Datentypen String, normalizedString, oder byteString zur Auswahl.
Dateigruppe
Eine Dateigruppenoption wird verwendet, um mehrere XML-Dateien zu lesen, die auf demselben xsd basieren. Wählen Sie das Eingabeschema-Element aus, das in der Laufzeit die absoluten Pfade (Beispiel: c:\test.xml) der XML-Dateien enthalten soll. Nur Elemente, die die Datentypen 'String', 'normalizedString' oder 'byteString' haben, stehen zur Auswahl zur Verfügung.
Filterung aktivieren
Aktivieren Sie das Filtern, um ein XSLT-Style-Sheet auf das Dokument anzuwenden, bevor es syntaktisch analysiert wird. Das Dokumentstammverzeichnis muss das Dokument widerspiegeln, das aus dem Ergebnis der XSLT-Transformation erstellt wurde. Diese Option wird für große Dokumente nicht empfohlen, da die gesamte Verarbeitung im Speicher ausgeführt wird. Für große Dokumente verwenden Sie Transformationsschritte.

Dokumentstammverzeichnis

Wählen Sie das Element der höchsten Ebene aus, das die Dokumente beschreibt, die Sie syntaktisch analysieren. Die Typen, die unter dem Namespace der Bibliothek angezeigt werden, sind Elementdefinitionen der höchsten Ebene. Nach dem XML-Schema-Standard können nur Elemente der höchsten Ebene Dokumente beschreiben. Der Name des Elements, das Sie auswählen, muss mit dem Elementnamen der höchsten Ebene in den Instanzdokumenten übereinstimmen. Wenn Sie zum Beispiel Auftragsdokumente syntaktisch analysieren, wählen Sie das Element 'Order' aus. Wenn Sie das Element auswählen, können Sie dessen Struktur anzeigen und überprüfen, ob die Struktur für die Dokumente korrekt ist, die syntaktisch analysiert werden sollen.
Hinweis Die Elemente, aus denen Sie das Dokumentstammverzeichnis auswählen, stammen aus den Ressourcen, die zuvor in die Schemabibliotheken importiert wurden. Wenn Sie die Ressource importieren müssen, die das Dokumentstammverzeichnis für den XML-Parserschritt enthält, klicken Sie auf Bibliotheken öffnen, und importieren Sie die Ressource, die Sie benötigen. Kehren Sie anschließend in den Assembly Editor zurück, und konfigurieren Sie das Dokumentstammverzeichnis.

Validierung

Wenn der Schritt des XML-Parsers ausgeführt wird, verwendet er standardmäßig eine minimale Validierung, die alle Prüfregeln inaktiviert und eine bessere Leistung bietet als die strikte Validierung. Die strikte Validierung ist zunächst so konfiguriert, dass jede Prüfregel auf 'Fatal' gesetzt ist und der Job gestoppt wird, sobald er das erste Vorkommen von ungültigen Daten syntaktisch analysiert. Um die Validierung anzupassen, geben Sie die Aktion an, die ausgeführt werden soll, wenn ein Verstoß auftritt.

Weitere Informationen über Validierungsregeln finden Sie unter XML-Parser-Validierungsregeln (DataStage).