Mit dem Knoten Erweiterungsimport können Sie Skripts ausführen, die in R, Python oder Python für Spark geschrieben wurden, um Daten zu importieren.
Nachdem Sie den Knoten an Ihren Erstellungsbereich angepasst haben, doppelklicken Sie auf den Knoten, um seine Eigenschaften zu öffnen.
Syntax (Registerkarte)
Wählen Sie die Art der Syntax - R, Python oder Python für Spark. Geben Sie dann Ihr angepasstes Script für das Importieren von Daten oder fügen Sie es ein. Wenn Ihre Syntax bereit ist, können Sie den Knoten ausführen.
Registerkarte "Konsolenausgabe"
Das Register Konsolenausgabe enthält alle Ausgaben, die bei der Ausführung des R-Skripts oder Python empfangen werden (bei Verwendung eines R-Skripts wird beispielsweise die Ausgabe angezeigt, die von der R-Konsole empfangen wird, wenn das R-Skript im Feld R-Syntax im Register Syntax ausgeführt wird). Diese Ausgabe kann Fehlernachrichten oder Warnungen zu R oder Python enthalten, die beim Ausführen des R- oder Python-Scripts erzeugt werden. Die Ausgabe kann in erster Linie für das Debugging des R-Scripts verwendet werden. Die Registerkarte Konsolenausgabe enthält außerdem das im Feld R-Syntax oder Python-Syntax angegebene Script.
Jedes Mal, wenn das Skript Erweiterungsimport ausgeführt wird, wird der Inhalt der Registerkarte Konsolenausgabe mit der von der R- oder Python empfangenen Ausgabe überschrieben. Sie können die Ausgabe nicht bearbeiten.
Filtern oder Umbenennen von Feldern
Das Umbenennen und Ausschließen von Feldern ist an jedem beliebigen Punkt in einem Ablauf möglich. Beispiel: Bei einer medizinischen Studie ist möglicherweise der Kaliumspiegel (Daten der Feldebene) der Patienten (Daten der Datensatzebene) nicht relevant. Daher können Sie das Feld K
(Kalium) herausfiltern.
- Mithilfe eines Filterknotens können Sie Felder an jeder Stelle des Ablaufs umbenennen oder filtern.
- Sie können mit einem Filterknoten Felder aus einem Importknoten einem anderen Importknoten zuweisen.
Informationen zu Typen anzeigen und festlegen
Im Typknoten können Sie Feldmetadaten und Eigenschaften angeben, die für die Modellierung und andere Arbeiten von unschätzbarem Wert sind.- Angabe eines Verwendungstyps, wie Bereich, Set, sortiertes Set oder Flag, für die einzelnen Felder in Ihren Daten.
- Festlegen von Optionen für den Umgang mit fehlenden Werten und systemdefinierten Nullwerten.
- Festlegen der Rolle eines Felds zu Modellierungszwecken.
- Angabe von Werten für ein Feld und von Optionen, die zum automatischen Lesen von Werten aus Ihren Daten verwendet werden.
- Angabe von Wertbeschriftungen.