0 / 0
Zurück zur englischen Version der Dokumentation
binningnode, Eigenschaften
Letzte Aktualisierung: 07. Okt. 2024
binningnode, Eigenschaften

Symbol für Binning-KnotenDer Klassierknoten erstellt automatisch neue nominale Felder (Setfelder) auf der Grundlage der Werte eines oder mehrerer bestehender stetiger Felder (numerischer Bereich). Sie können beispielsweise ein stetiges Einkommensfeld in ein neues kategoriales Feld transformieren, das Einkommensgruppen als Abweichungen vom Mittelwert enthält. Nachdem Sie Klassen für das neue Feld erstellt haben, können Sie einen Ableitungsknoten auf der Basis der Trennwerte generieren.

Beispiel

node = stream.create("binning", "My node")
node.setPropertyValue("fields", ["Na", "K"])
node.setPropertyValue("method", "Rank")
node.setPropertyValue("fixed_width_name_extension", "_binned")
node.setPropertyValue("fixed_width_add_as", "Suffix")
node.setPropertyValue("fixed_bin_method", "Count")
node.setPropertyValue("fixed_bin_count", 10)
node.setPropertyValue("fixed_bin_width", 3.5)
node.setPropertyValue("tile10", True)
Tabelle 1. Eigenschaften von "binningnode"
binningnodeEigenschaften Datentyp Eigenschaftsbeschreibung
fields [field1 field2 ... Feldn] Stetige Felder (numerischer Bereich) mit ausstehender Transformation. Sie können mehrere Felder gleichzeitig klassieren.
method FixedWidth EqualCount Rank SDev Optimal Methode, die zur Ermittlung der Trennwerte für neue Feld-Bins (Kategorien) verwendet wird.
recalculate_bins Always IfNecessary Gibt an, ob bei jeder Ausführung des Knotens die Klassen neu berechnet und die Daten in die relevante Klasse eingeordnet werden sollen oder ob Daten nur zu bestehenden Klassen und etwaig hinzugefügten neuen Klassen hinzugefügt werden sollen.
fixed_width_name_extension Zeichenfolge Die Standarderweiterung lautet _BIN.
fixed_width_add_as Suffix Prefix Gibt an, ob die Erweiterung am Ende (Suffix) oder am Anfang (Präfix) des Feldnamens eingefügt werden soll. Die Standarderweiterung lautet income_BIN.
fixed_bin_method Width Count  
fixed_bin_count Ganze Zahl Gibt eine Ganzzahl an, die zur Bestimmung der Anzahl der Klassen (Kategorien) mit fester Breite für die neuen Felder verwendet wird.
fixed_bin_width real Wert (ganzzahlig oder reell), der zu Berechnung der Breite der Klasse verwendet wird.
equal_count_name_ extension Zeichenfolge Die Standarderweiterung lautet _TILE.
equal_count_add_as Suffix Prefix Gibt eine Erweiterung (Suffix oder Präfix) an, die für die mithilfe von Standard-N-Perzentilen generierten Felder verwendet wird. Die Standarderweiterung ist _TILE plus N; dabei steht N für die Nummer des Perzentils.
tile4 Markierung Generiert vier Quantilklassen, die jeweils 25 % der Fälle enthalten.
tile5 Markierung Generiert fünf Qintilklassen.
tile10 Markierung Generiert 10 Dezilklassen.
tile20 Markierung Generiert 20 Vingtilklassen.
tile100 Markierung Generiert 100 Perzentilklassen.
use_custom_tile Markierung  
custom_tile_name_extension Zeichenfolge Die Standarderweiterung lautet _TILEN.
custom_tile_add_as Suffix Prefix  
custom_tile Ganze Zahl  
equal_count_method RecordCount ValueSum Die Methode RecordCountversucht, jeder Klasse eine gleiche Anzahl von Datensätzen zuzuweisen, während ValueSumDatensätze so zuordnet, dass die Summe der Werte in jeder Klasse gleich ist.
tied_values_method Next Current Random Gibt an, in welche Klasse Daten mit gebundenen Werten (Werten mit Gleichstand) eingeordnet werden sollen.
rank_order Ascending Descending Diese Eigenschaft enthält Ascending(niedrigster Wert ist mit 1 markiert) oder Descending(höchster Wert ist mit 1 markiert).
rank_add_as Suffix Prefix Mit dieser Option werden Rang, relativer Rang und Prozentsatzrang angewendet.
rank Markierung  
rank_name_extension Zeichenfolge Die Standarderweiterung lautet _RANK.
rank_fractional Markierung Weist Fällen Ränge zu, wobei der Wert des neuen Felds gleich dem Rang dividiert durch die Summe der Gewichtungen der nicht fehlenden Fälle ist. Relative Ränge fallen in den Bereich zwischen 0 und 1.
rank_fractional_name_ extension Zeichenfolge Die Standarderweiterung lautet _F_RANK.
rank_pct Markierung Die einzelnen Ränge werden durch die Anzahl der Datensätze mit gültigen Werten dividiert und mit 100 multipliziert. Als Prozentsatz angegebene Bruchzahlränge fallen in den Bereich 1-100.
rank_pct_name_extension Zeichenfolge Die Standarderweiterung lautet _P_RANK.
sdev_name_extension Zeichenfolge  
sdev_add_as Suffix Prefix  
sdev_count One Two Three  
optimal_name_extension Zeichenfolge Die Standarderweiterung lautet _OPTIMAL.
optimal_add_as Suffix Prefix  
optimal_supervisor_field Feld Als Supervisorfeld ausgewähltes Feld, mit dem die für die Klassierung ausgewählten Felder in Bezug stehen.
optimal_merge_bins Markierung Gibt an, dass alle Klassen mit kleinen Fallzahlen zu einer größeren, benachbarten Klasse hinzugefügt werden.
optimal_small_bin_threshold Ganze Zahl  
optimal_pre_bin Markierung Gibt an, dass eine Vorklassierung des Datasets durchgeführt werden soll.
optimal_max_bins Ganze Zahl Gibt eine Obergrenze an, um das Erstellen einer übermäßig großen Anzahl von Feldern zu verhindern.
optimal_lower_end_point Inclusive Exclusive  
optimal_first_bin Unbounded Bounded  
optimal_last_bin Unbounded Bounded  
Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen