Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
Vstupní pole na uzlu výběru funkcí se provádí pro odstranění na základě sady kritérií (jako například procentní podíl chybějících hodnot); potom ohodností důležitost zbývajících vstupů vzhledem k zadanému cíli. Například vzhledem k datové sadě se stovkami potencionálních vstupů, které jsou s největší pravděpodobností užitečné při modelování výsledků pacientů?
Příklad
node = stream.create("featureselection", "My node")
node.setPropertyValue("screen_single_category", True)
node.setPropertyValue("max_single_category", 95)
node.setPropertyValue("screen_missing_values", True)
node.setPropertyValue("max_missing_values", 80)
node.setPropertyValue("criteria", "Likelihood")
node.setPropertyValue("unimportant_below", 0.8)
node.setPropertyValue("important_above", 0.9)
node.setPropertyValue("important_label", "Check Me Out!")
node.setPropertyValue("selection_mode", "TopN")
node.setPropertyValue("top_n", 15)
featureselectionnode Vlastnosti |
Hodnoty | Popis vlastnosti |
---|---|---|
target |
pole | Modely výběru funkcí hodnotí prediktory relativně vzhledem k zadanému cíli. Pole Váha a frekvence se nepoužívají. Další informace naleznete v tématu Obecné vlastnosti uzlu modelování . |
screen_single_category |
příznak | Pokud True , pole obrazovek, které mají příliš mnoho záznamů, které spadají do stejné kategorie vzhledem k celkovému počtu záznamů. |
max_single_category |
Číslo | Uvádí prahovou hodnotu, která se použije, když screen_single_category je True . |
screen_missing_values |
příznak | Pokud True , pole obrazovek s příliš mnoha chybějícími hodnotami, vyjádřeno jako procento z celkového počtu záznamů. |
max_missing_values |
Číslo | |
screen_num_categories |
příznak | Pokud True , obrazovky polí s příliš mnoha kategoriemi vzhledem k celkovému počtu záznamů. |
max_num_categories |
Číslo | |
screen_std_dev |
příznak | Pokud True , pole obrazovek se směrodatnou odchylkou menší než nebo rovnou uvedenému minimu. |
min_std_dev |
Číslo | |
screen_coeff_of_var |
příznak | Pokud True , pole obrazovek s koeficientem rozptylu je menší nebo roven zadanému minimu. |
min_coeff_of_var |
Číslo | |
criteria |
Pearson Likelihood CramersV Lambda |
Při hodnocení kategoriálních prediktorů vůči kategorickém cíli určuje měřítko, na kterém je založena hodnota důležitosti. |
unimportant_below |
Číslo | Určuje prahové hodnoty p použité k ohodnocení důležitosti proměnných jako důležitých, okrajových nebo nedůležitých. Přijímá hodnoty od 0.0 do 1.0. |
important_above |
Číslo | Přijímá hodnoty od 0.0 do 1.0. |
unimportant_label |
řetězec | Určuje popisek pro nevýznamné hodnocení. |
marginal_label |
řetězec | |
important_label |
řetězec | |
selection_mode |
ImportanceLevel ImportanceValue TopN |
|
select_important |
příznak | Je-li parametr selection_mode nastaven na hodnotu ImportanceLevel , určuje, zda mají být vybrána důležitá pole. |
select_marginal |
příznak | Je-li parametr selection_mode nastaven na hodnotu ImportanceLevel , určuje, zda mají být vybrána mezní pole. |
select_unimportant |
příznak | Je-li parametr selection_mode nastaven na hodnotu ImportanceLevel , určuje, zda mají být vybrána nedůležitá pole. |
importance_value |
Číslo | Je-li parametr selection_mode nastaven na hodnotu ImportanceValue , určuje hodnotu uzavření objektu, která má být použita. Přijímá hodnoty od 0 do 100. |
top_n |
celočíselná hodnota | Je-li parametr selection_mode nastaven na hodnotu TopN , určuje hodnotu uzavření objektu, která má být použita. Přijímá hodnoty od 0 do 1000. |