featureselectionnode, Eigenschaften
Letzte Aktualisierung: 11. Feb. 2025
Der Merkmalauswahlknoten sichtet die Eingabefelder, um auf der Grundlage einer Reihe von Kriterien (z. B. dem Prozentsatz der fehlenden Werte) zu entscheiden, ob diese entfernt werden sollen. Anschließend erstellt er eine Wichtigkeitsrangfolge der verbleibenden Eingaben in Bezug auf ein angegebenes Ziel. Beispiel: Angenommen, Sie haben ein Dataset mit Hunderten potenzieller Eingaben. Welche davon sind voraussichtlich für die Modellierung von medizinischen Behandlungsergebnissen von Bedeutung?
Beispiel
node = stream.create("featureselection", "My node") node.setPropertyValue("screen_single_category", True) node.setPropertyValue("max_single_category", 95) node.setPropertyValue("screen_missing_values", True) node.setPropertyValue("max_missing_values", 80) node.setPropertyValue("criteria", "Likelihood") node.setPropertyValue("unimportant_below", 0.8) node.setPropertyValue("important_above", 0.9) node.setPropertyValue("important_label", "Check Me Out!") node.setPropertyValue("selection_mode", "TopN") node.setPropertyValue("top_n", 15)
Eigenschaften |
Werte | Eigenschaftsbeschreibung |
---|---|---|
|
Feld | Merkmalauswahlmodelle teilen Prädiktoren relativ zum angegebenen Ziel in Ränge ein. Gewichtungs- und Häufigkeitsfelder werden nicht verwendet. Weitere Informationen finden Sie unter Allgemeine Eigenschaften von Modellierungsknoten . |
|
Markierung | Bei werden Felder mit zu vielen Datensätzen, die in dieselbe Kategorie fallen, im Verhältnis zur Gesamtzahl der Datensätze angezeigt. |
|
Zahl | Gibt den Schwellenwert an, der verwendet wird, wenn auf gesetzt ist. |
|
Markierung | Bei werden Felder mit zu vielen fehlenden Werten als Prozentsatz der Gesamtzahl der Datensätze angezeigt. |
|
Zahl | |
|
Markierung | Bei werden Felder mit zu vielen Kategorien relativ zur Gesamtzahl der Datensätze angezeigt. |
|
Zahl | |
|
Markierung | Bei werden Felder mit einer Standardabweichung kleiner-gleich dem angegebenen Minimum angezeigt. |
|
Zahl | |
|
Markierung | Bei werden Felder mit einem Varianzkoeffizienten kleiner-gleich dem angegebenen Minimum angezeigt. |
|
Zahl | |
|
|
Wenn kategoriale Prädiktoren hinsichtlich eines kategorialen Ziels nach Rängen geordnet werden, wird hier das Maß angegeben, auf dem der Wert für die Wichtigkeit beruht. |
|
Zahl | Gibt die p-Schwellenwerte an, die verwendet werden, um Variablen als "bedeutsam", "marginal" bzw. "unbedeutend" eingestuft werden. Zulässig sind Werte von 0,0 bis 1,0. |
|
Zahl | Zulässig sind Werte von 0,0 bis 1,0. |
|
Zeichenfolge | Gibt die Beschriftung für die Rangstufe "unbedeutsam" an. |
|
Zeichenfolge | |
|
Zeichenfolge | |
|
|
|
|
Markierung | Wenn auf gesetzt ist, gibt dies an, ob wichtige Felder ausgewählt werden. |
|
Markierung | Wenn auf gesetzt ist, gibt diese Option an, ob Randfelder ausgewählt werden sollen. |
|
Markierung | Wenn auf gesetzt ist, wird angegeben, ob unwichtige Felder ausgewählt werden sollen oder nicht. |
|
Zahl | Wenn auf gesetzt ist, wird der zu verwendende Trennwert angegeben. Zulässig sind Werte von 0 bis 100. |
|
Ganze Zahl | Wenn auf gesetzt ist, wird der zu verwendende Trennwert angegeben. Zulässig sind Werte von 0 bis 1000. |
War das Thema hilfreich?
0/1000