proprietà featureselectionnode
Ultimo aggiornamento: 11 feb 2025
Il nodo Selezione funzioni effettua lo screening dei campi di input, rimuovendoli in base a un insieme di criteri quali la percentuale di valori mancanti. Classifica quindi gli input restanti in ordine di importanza rispetto a un determinato obiettivo. Per esempio, dato un insieme di dati con centinaia di input potenziali, quali sono quelli con la maggiore probabilità di essere utili nella modellazione di risultati clinici?
Esempio
node = stream.create("featureselection", "My node") node.setPropertyValue("screen_single_category", True) node.setPropertyValue("max_single_category", 95) node.setPropertyValue("screen_missing_values", True) node.setPropertyValue("max_missing_values", 80) node.setPropertyValue("criteria", "Likelihood") node.setPropertyValue("unimportant_below", 0.8) node.setPropertyValue("important_above", 0.9) node.setPropertyValue("important_label", "Check Me Out!") node.setPropertyValue("selection_mode", "TopN") node.setPropertyValue("top_n", 15)
proprietà |
Valori | Descrizione proprietà |
---|---|---|
|
campo | I modelli di selezione funzioni classificano i predittori rispetto all'obiettivo specificato. I campi peso e frequenza non sono utilizzati. Per ulteriori informazioni, consultare Proprietà comuni del nodo Modelli . |
|
indicatore | Se , esegue lo screening dei campi che hanno troppi record che rientrano nella stessa categoria rispetto al numero totale di record. |
|
numero | Specifica la soglia utilizzata quando è . |
|
indicatore | Se , seleziona i campi con troppi valori mancanti, espressi come percentuale del numero totale di record. |
|
numero | |
|
indicatore | Se , esegue lo screening dei campi con troppe categorie rispetto al numero totale di record. |
|
numero | |
|
indicatore | Se , esegue lo screening dei campi con una deviazione standard inferiore o uguale al minimo specificato. |
|
numero | |
|
indicatore | Se , seleziona i campi con un coefficiente di varianza inferiore o uguale al minimo specificato. |
|
numero | |
|
|
Quando si classificano i predittori categoriali rispetto a un obiettivo categoriale, specifica la misura sulla quale si basa il valore di importanza. |
|
numero | Specifica i valori p di soglia utilizzati per classificare variabili quali importante, marginale o non importante. Accetta i valori compresi fra 0.0 e 1.0. |
|
numero | Accetta i valori compresi fra 0.0 e 1.0. |
|
Stringa | Specifica l'etichetta per la classificazione non importante. |
|
Stringa | |
|
Stringa | |
|
|
|
|
indicatore | Quando è impostata su , specifica se selezionare i campi importanti. |
|
indicatore | Quando è impostata su , specifica se selezionare i campi marginali. |
|
indicatore | Quando è impostata su , specifica se selezionare i campi non importanti. |
|
numero | Quando è impostata su , specifica il valore di interruzione da utilizzare. Accetta i valori compresi tra 0 e 100. |
|
intero | Quando è impostata su , specifica il valore di interruzione da utilizzare. Accetta i valori compresi tra 0 e 1000. |
L'argomento è stato utile?
0/1000