dataauditnode, Eigenschaften
Letzte Aktualisierung: 11. Feb. 2025
Der Data Audit-Knoten bietet einen umfassenden ersten Einblick in die Daten mit statistischen Funktionen, Histogrammen und der Verteilung für die einzelnen Felder sowie Informationen zu Ausreißern, fehlenden Werten und Extremwerten. Die Ergebnisse werden in einer übersichtlichen Matrix dargestellt, die sortiert werden kann und als Grundlage für die Erzeugung normal großer Diagramme und Datenvorbereitungsknoten dient.
Beispiel
stream = modeler.script.stream()
sourcenode = stream.findByID("id46WRP1285C")
node = stream.createAt("dataaudit", "My node", 196, 100)
stream.link(sourcenode, node)
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("fields", ["Age", "Na", "K"])
node.setPropertyValue("display_graphs", True)
node.setPropertyValue("basic_stats", True)
node.setPropertyValue("advanced_stats", True)
node.setPropertyValue("median_stats", False)
node.setPropertyValue("calculate", ["Count", "Breakdown"])
node.setPropertyValue("outlier_detection_method", "std")
node.setPropertyValue("outlier_detection_std_outlier", 1.0)
node.setPropertyValue("outlier_detection_std_extreme", 3.0)
node.setPropertyValue("output_mode", "Screen")
dataauditnode Eigenschaften |
Datentyp | Eigenschaftsbeschreibung |
---|---|---|
custom_fields |
Markierung | |
fields |
[field1 … fieldN] | |
overlay |
Feld | |
display_graphs |
Markierung | Dient zur Aktivierung bzw. Inaktivierung der Anzeige von Diagrammen in der Ausgabematrix. |
basic_stats |
Markierung | |
advanced_stats |
Markierung | |
median_stats |
Markierung | |
calculate |
Count Breakdown |
Dient zur Berechnung fehlender Werte. Sie können eine der beiden Berechnungsmethoden, beide Methoden oder auch keine der Methoden auswählen. |
outlier_detection_method |
std iqr |
Dient zur Angabe der Erkennungsmethode für Ausreißer und Extremwerte. |
outlier_detection_std_outlier |
Zahl | Wenn outlier_detection_method auf std gesetzt ist, gibt dieser Wert die Anzahl an, die zum Definieren von Ausreißern verwendet werden soll. |
outlier_detection_std_extreme |
Zahl | Wenn outlier_detection_method auf std gesetzt ist, gibt dieser Wert die Anzahl an, die zum Definieren von Extremwerten verwendet werden soll. |
outlier_detection_iqr_outlier |
Zahl | Wenn outlier_detection_method auf iqr gesetzt ist, gibt dieser Wert die Anzahl an, die zum Definieren von Ausreißern verwendet werden soll. |
outlier_detection_iqr_extreme |
Zahl | Wenn outlier_detection_method auf iqr gesetzt ist, gibt dieser Wert die Anzahl an, die zum Definieren von Extremwerten verwendet werden soll. |
use_output_name |
Markierung | Gibt an, ob ein benutzerdefinierter Ausgabename verwendet wird. |
output_name |
Zeichenfolge | Wenn use_output_name auf "true" gesetzt ist, wird der zu verwendende Name angegeben. |
output_mode |
Screen File |
Dient zur Angabe des Zielorts für die vom Ausgabeknoten erstellte Ausgabe. |
output_format |
Formatted (.tab) Delimited (.csv) HTML (.html) Output (.cou) |
Dient zur Angabe des Ausgabetyps. |
paginate_output |
Markierung | Wenn output_format auf HTML gesetzt ist, wird die Ausgabe in Seiten unterteilt. |
lines_per_page |
Zahl | Gibt bei Verwendung mit paginate_output die Zeilen pro Seite der Ausgabe an. |
full_filename |
Zeichenfolge |
War das Thema hilfreich?
0/1000