0 / 0
Go back to the English version of the documentation
Vlastnosti funkce featureselectionnode
Last updated: 04. 7. 2023
Vlastnosti funkce featureselectionnode

Ikona uzlu výběru funkcíVstupní pole na uzlu výběru funkcí se provádí pro odstranění na základě sady kritérií (jako například procentní podíl chybějících hodnot); potom ohodností důležitost zbývajících vstupů vzhledem k zadanému cíli. Například vzhledem k datové sadě se stovkami potencionálních vstupů, které jsou s největší pravděpodobností užitečné při modelování výsledků pacientů?

Příklad

node = stream.create("featureselection", "My node")
node.setPropertyValue("screen_single_category", True)
node.setPropertyValue("max_single_category", 95)
node.setPropertyValue("screen_missing_values", True)
node.setPropertyValue("max_missing_values", 80)
node.setPropertyValue("criteria", "Likelihood")
node.setPropertyValue("unimportant_below", 0.8)
node.setPropertyValue("important_above", 0.9)
node.setPropertyValue("important_label", "Check Me Out!")
node.setPropertyValue("selection_mode", "TopN")
node.setPropertyValue("top_n", 15)
Tabulka 1. Vlastnosti funkce featureselectionnode
featureselectionnode Vlastnosti Hodnoty Popis vlastnosti
target pole Modely výběru funkcí hodnotí prediktory relativně vzhledem k zadanému cíli. Pole Váha a frekvence se nepoužívají. Další informace naleznete v tématu Obecné vlastnosti uzlu modelování .
screen_single_category příznak Pokud True, pole obrazovek, které mají příliš mnoho záznamů, které spadají do stejné kategorie vzhledem k celkovému počtu záznamů.
max_single_category Číslo Uvádí prahovou hodnotu, která se použije, když screen_single_category je True.
screen_missing_values příznak Pokud True, pole obrazovek s příliš mnoha chybějícími hodnotami, vyjádřeno jako procento z celkového počtu záznamů.
max_missing_values Číslo  
screen_num_categories příznak Pokud True, obrazovky polí s příliš mnoha kategoriemi vzhledem k celkovému počtu záznamů.
max_num_categories Číslo  
screen_std_dev příznak Pokud True, pole obrazovek se směrodatnou odchylkou menší než nebo rovnou uvedenému minimu.
min_std_dev Číslo  
screen_coeff_of_var příznak Pokud True, pole obrazovek s koeficientem rozptylu je menší nebo roven zadanému minimu.
min_coeff_of_var Číslo  
criteria Pearson Likelihood CramersV Lambda Při hodnocení kategoriálních prediktorů vůči kategorickém cíli určuje měřítko, na kterém je založena hodnota důležitosti.
unimportant_below Číslo Určuje prahové hodnoty p použité k ohodnocení důležitosti proměnných jako důležitých, okrajových nebo nedůležitých. Přijímá hodnoty od 0.0 do 1.0.
important_above Číslo Přijímá hodnoty od 0.0 do 1.0.
unimportant_label řetězec Určuje popisek pro nevýznamné hodnocení.
marginal_label řetězec  
important_label řetězec  
selection_mode ImportanceLevel ImportanceValue TopN  
select_important příznak Je-li parametr selection_mode nastaven na hodnotu ImportanceLevel, určuje, zda mají být vybrána důležitá pole.
select_marginal příznak Je-li parametr selection_mode nastaven na hodnotu ImportanceLevel, určuje, zda mají být vybrána mezní pole.
select_unimportant příznak Je-li parametr selection_mode nastaven na hodnotu ImportanceLevel, určuje, zda mají být vybrána nedůležitá pole.
importance_value Číslo Je-li parametr selection_mode nastaven na hodnotu ImportanceValue, určuje hodnotu uzavření objektu, která má být použita. Přijímá hodnoty od 0 do 100.
top_n celočíselná hodnota Je-li parametr selection_mode nastaven na hodnotu TopN, určuje hodnotu uzavření objektu, která má být použita. Přijímá hodnoty od 0 do 1000.
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more