dataauditnode, Eigenschaften

Letzte Aktualisierung: 11. Feb. 2025
dataauditnode, Eigenschaften

Symbol für Data Audit-KnotenDer Data Audit-Knoten bietet einen umfassenden ersten Einblick in die Daten mit statistischen Funktionen, Histogrammen und der Verteilung für die einzelnen Felder sowie Informationen zu Ausreißern, fehlenden Werten und Extremwerten. Die Ergebnisse werden in einer übersichtlichen Matrix dargestellt, die sortiert werden kann und als Grundlage für die Erzeugung normal großer Diagramme und Datenvorbereitungsknoten dient.

Beispiel

stream = modeler.script.stream()
sourcenode = stream.findByID("id46WRP1285C")
node = stream.createAt("dataaudit", "My node", 196, 100)
stream.link(sourcenode, node)
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("fields", ["Age", "Na", "K"])
node.setPropertyValue("display_graphs", True)
node.setPropertyValue("basic_stats", True)
node.setPropertyValue("advanced_stats", True)
node.setPropertyValue("median_stats", False)
node.setPropertyValue("calculate", ["Count", "Breakdown"])
node.setPropertyValue("outlier_detection_method", "std")
node.setPropertyValue("outlier_detection_std_outlier", 1.0)
node.setPropertyValue("outlier_detection_std_extreme", 3.0)
node.setPropertyValue("output_mode", "Screen")
Tabelle 1. Eigenschaften von "dataauditnode"
dataauditnodeEigenschaften Datentyp Eigenschaftsbeschreibung
custom_fields Markierung  
fields [field1 … fieldN]  
overlay Feld  
display_graphs Markierung Dient zur Aktivierung bzw. Inaktivierung der Anzeige von Diagrammen in der Ausgabematrix.
basic_stats Markierung  
advanced_stats Markierung  
median_stats Markierung  
calculate Count Breakdown Dient zur Berechnung fehlender Werte. Sie können eine der beiden Berechnungsmethoden, beide Methoden oder auch keine der Methoden auswählen.
outlier_detection_method std iqr Dient zur Angabe der Erkennungsmethode für Ausreißer und Extremwerte.
outlier_detection_std_outlier Zahl Wenn outlier_detection_method auf std gesetzt ist, gibt dieser Wert die Anzahl an, die zum Definieren von Ausreißern verwendet werden soll.
outlier_detection_std_extreme Zahl Wenn outlier_detection_method auf std gesetzt ist, gibt dieser Wert die Anzahl an, die zum Definieren von Extremwerten verwendet werden soll.
outlier_detection_iqr_outlier Zahl Wenn outlier_detection_method auf iqr gesetzt ist, gibt dieser Wert die Anzahl an, die zum Definieren von Ausreißern verwendet werden soll.
outlier_detection_iqr_extreme Zahl Wenn outlier_detection_method auf iqr gesetzt ist, gibt dieser Wert die Anzahl an, die zum Definieren von Extremwerten verwendet werden soll.
use_output_name Markierung Gibt an, ob ein benutzerdefinierter Ausgabename verwendet wird.
output_name Zeichenfolge Wenn use_output_name auf "true" gesetzt ist, wird der zu verwendende Name angegeben.
output_mode Screen File Dient zur Angabe des Zielorts für die vom Ausgabeknoten erstellte Ausgabe.
output_format Formatted (.tab) Delimited (.csv) HTML (.html) Output (.cou) Dient zur Angabe des Ausgabetyps.
paginate_output Markierung Wenn output_format auf HTML gesetzt ist, wird die Ausgabe in Seiten unterteilt.
lines_per_page Zahl Gibt bei Verwendung mit paginate_output die Zeilen pro Seite der Ausgabe an.
full_filename Zeichenfolge