Zurück zur englischen Version der Dokumentationbinningnode, Eigenschaften
binningnode, Eigenschaften
Letzte Aktualisierung: 07. Okt. 2024
Der Klassierknoten erstellt automatisch neue nominale Felder (Setfelder) auf der Grundlage der Werte eines oder mehrerer bestehender stetiger Felder (numerischer Bereich). Sie können beispielsweise ein stetiges Einkommensfeld in ein neues kategoriales Feld transformieren, das Einkommensgruppen als Abweichungen vom Mittelwert enthält. Nachdem Sie Klassen für das neue Feld erstellt haben, können Sie einen Ableitungsknoten auf der Basis der Trennwerte generieren.
Beispiel
node = stream.create("binning", "My node")
node.setPropertyValue("fields", ["Na", "K"])
node.setPropertyValue("method", "Rank")
node.setPropertyValue("fixed_width_name_extension", "_binned")
node.setPropertyValue("fixed_width_add_as", "Suffix")
node.setPropertyValue("fixed_bin_method", "Count")
node.setPropertyValue("fixed_bin_count", 10)
node.setPropertyValue("fixed_bin_width", 3.5)
node.setPropertyValue("tile10", True)
binningnode Eigenschaften |
Datentyp | Eigenschaftsbeschreibung |
---|---|---|
fields |
[field1 field2 ... Feldn] | Stetige Felder (numerischer Bereich) mit ausstehender Transformation. Sie können mehrere Felder gleichzeitig klassieren. |
method |
FixedWidth EqualCount Rank SDev Optimal |
Methode, die zur Ermittlung der Trennwerte für neue Feld-Bins (Kategorien) verwendet wird. |
recalculate_bins |
Always IfNecessary |
Gibt an, ob bei jeder Ausführung des Knotens die Klassen neu berechnet und die Daten in die relevante Klasse eingeordnet werden sollen oder ob Daten nur zu bestehenden Klassen und etwaig hinzugefügten neuen Klassen hinzugefügt werden sollen. |
fixed_width_name_extension |
Zeichenfolge | Die Standarderweiterung lautet _BIN. |
fixed_width_add_as |
Suffix Prefix |
Gibt an, ob die Erweiterung am Ende (Suffix) oder am Anfang (Präfix) des Feldnamens eingefügt werden soll. Die Standarderweiterung lautet income_BIN. |
fixed_bin_method |
Width Count |
|
fixed_bin_count |
Ganze Zahl | Gibt eine Ganzzahl an, die zur Bestimmung der Anzahl der Klassen (Kategorien) mit fester Breite für die neuen Felder verwendet wird. |
fixed_bin_width |
real | Wert (ganzzahlig oder reell), der zu Berechnung der Breite der Klasse verwendet wird. |
equal_count_name_ extension |
Zeichenfolge | Die Standarderweiterung lautet _TILE. |
equal_count_add_as |
Suffix Prefix |
Gibt eine Erweiterung (Suffix oder Präfix) an, die für die mithilfe von Standard-N-Perzentilen generierten Felder verwendet wird. Die Standarderweiterung ist _TILE plus N; dabei steht N für die Nummer des Perzentils. |
tile4 |
Markierung | Generiert vier Quantilklassen, die jeweils 25 % der Fälle enthalten. |
tile5 |
Markierung | Generiert fünf Qintilklassen. |
tile10 |
Markierung | Generiert 10 Dezilklassen. |
tile20 |
Markierung | Generiert 20 Vingtilklassen. |
tile100 |
Markierung | Generiert 100 Perzentilklassen. |
use_custom_tile |
Markierung | |
custom_tile_name_extension |
Zeichenfolge | Die Standarderweiterung lautet _TILEN. |
custom_tile_add_as |
Suffix Prefix |
|
custom_tile |
Ganze Zahl | |
equal_count_method |
RecordCount ValueSum |
Die Methode RecordCount versucht, jeder Klasse eine gleiche Anzahl von Datensätzen zuzuweisen, während ValueSum Datensätze so zuordnet, dass die Summe der Werte in jeder Klasse gleich ist. |
tied_values_method |
Next Current Random |
Gibt an, in welche Klasse Daten mit gebundenen Werten (Werten mit Gleichstand) eingeordnet werden sollen. |
rank_order |
Ascending Descending |
Diese Eigenschaft enthält Ascending (niedrigster Wert ist mit 1 markiert) oder Descending (höchster Wert ist mit 1 markiert). |
rank_add_as |
Suffix Prefix |
Mit dieser Option werden Rang, relativer Rang und Prozentsatzrang angewendet. |
rank |
Markierung | |
rank_name_extension |
Zeichenfolge | Die Standarderweiterung lautet _RANK. |
rank_fractional |
Markierung | Weist Fällen Ränge zu, wobei der Wert des neuen Felds gleich dem Rang dividiert durch die Summe der Gewichtungen der nicht fehlenden Fälle ist. Relative Ränge fallen in den Bereich zwischen 0 und 1. |
rank_fractional_name_ extension |
Zeichenfolge | Die Standarderweiterung lautet _F_RANK. |
rank_pct |
Markierung | Die einzelnen Ränge werden durch die Anzahl der Datensätze mit gültigen Werten dividiert und mit 100 multipliziert. Als Prozentsatz angegebene Bruchzahlränge fallen in den Bereich 1-100. |
rank_pct_name_extension |
Zeichenfolge | Die Standarderweiterung lautet _P_RANK. |
sdev_name_extension |
Zeichenfolge | |
sdev_add_as |
Suffix Prefix |
|
sdev_count |
One Two Three |
|
optimal_name_extension |
Zeichenfolge | Die Standarderweiterung lautet _OPTIMAL. |
optimal_add_as |
Suffix Prefix |
|
optimal_supervisor_field |
Feld | Als Supervisorfeld ausgewähltes Feld, mit dem die für die Klassierung ausgewählten Felder in Bezug stehen. |
optimal_merge_bins |
Markierung | Gibt an, dass alle Klassen mit kleinen Fallzahlen zu einer größeren, benachbarten Klasse hinzugefügt werden. |
optimal_small_bin_threshold |
Ganze Zahl | |
optimal_pre_bin |
Markierung | Gibt an, dass eine Vorklassierung des Datasets durchgeführt werden soll. |
optimal_max_bins |
Ganze Zahl | Gibt eine Obergrenze an, um das Erstellen einer übermäßig großen Anzahl von Feldern zu verhindern. |
optimal_lower_end_point |
Inclusive Exclusive |
|
optimal_first_bin |
Unbounded Bounded |
|
optimal_last_bin |
Unbounded Bounded |