Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
Uzel stromu klasifikace a regrese (C & R) generuje rozhodovací strom, který vám umožňuje předpovídat nebo klasifikovat budoucí pozorování. Metoda používá rekurzivní rozdělení na oddíly k rozdělení záznamů odborné přípravy na segmenty minimalizací nečistoty v každém kroku, kde je uzel ve stromu považován za "čistý", pokud 100% případů v uzlu spadá do specifické kategorie cílového pole. Cílové a vstupní pole mohou být číselné rozsahy nebo kategoriální (nominální, ordinální nebo příznaky); všechna rozdělení jsou binární (pouze dvě podskupiny).
Příklad
node = stream.createAt("cart", "My node", 200, 100)
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "BP", "Cholesterol"])
# "Build Options" tab, "Objective" panel
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", """Grow Node Index 0 Children 1 2
Grow Node Index 2 Children 3 4""")
# "Build Options" tab, "Basics" panel
node.setPropertyValue("prune_tree", False)
node.setPropertyValue("use_std_err_rule", True)
node.setPropertyValue("std_err_multiplier", 3.0)
node.setPropertyValue("max_surrogates", 7)
# "Build Options" tab, "Stopping Rules" panel
node.setPropertyValue("use_percentage", True)
node.setPropertyValue("min_parent_records_pc", 5)
node.setPropertyValue("min_child_records_pc", 3)
# "Build Options" tab, "Advanced" panel
node.setPropertyValue("min_impurity", 0.0003)
node.setPropertyValue("impurity_measure", "Twoing")
# "Model Options" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Cart_Drug")
cartnode Vlastnosti |
Hodnoty | Popis vlastnosti |
---|---|---|
target |
pole | Modely C & R stromu vyžadují jeden cíl a jedno nebo více vstupních polí. Pole frekvence může být také uvedeno. Další informace naleznete v tématu Obecné vlastnosti uzlu modelování . |
continue_training_existing_model |
příznak | |
objective |
Standard Boosting Bagging psm |
Produkt psm se používá pro velmi rozsáhlé datové sady a vyžaduje připojení k serveru. |
model_output_type |
Single InteractiveBuilder |
|
use_tree_directives |
příznak | |
tree_directives |
řetězec | Zadejte direktivy pro růst stromu. Direktivy mohou být zalomeny v trojicích uvozovkách, aby se zabránilo úniku nových řádků nebo uvozovek. Všimněte si, že direktivy mohou být velmi citlivé na drobné změny v datech nebo modelování voleb a nemusí se zobecňovat do jiných datových sad. |
use_max_depth |
Default Custom |
|
max_depth |
celočíselná hodnota | Maximální hloubka stromu, od 0 do 1000. Používá se pouze, pokud use_max_depth
= Custom . |
prune_tree |
příznak | Vyčištěm strom, aby nedošlo k nadměrné montáži. |
use_std_err |
příznak | Použít maximální rozdíl v riziku (ve standardních chybách). |
std_err_multiplier |
Číslo | Maximální rozdíl. |
max_surrogates |
Číslo | Maximální náhradníci. |
use_percentage |
příznak | |
min_parent_records_pc |
Číslo | |
min_child_records_pc |
Číslo | |
min_parent_records_abs |
Číslo | |
min_child_records_abs |
Číslo | |
use_costs |
příznak | |
costs |
strukturované | Strukturovaná vlastnost. |
priors |
Data Equal Custom |
|
custom_priors |
strukturované | Strukturovaná vlastnost. |
adjust_priors |
příznak | |
trails |
Číslo | Počet modelů komponent pro zvýšení nebo zvýšení hodnoty. |
set_ensemble_method |
Voting HighestProbability HighestMeanProbability |
Výchozí kombinační pravidlo pro kategoriální cíle. |
range_ensemble_method |
Mean Median |
Výchozí kombinační pravidlo pro souvislé cíle. |
large_boost |
příznak | Aplikujte zesílení na velmi velké datové sady. |
min_impurity |
Číslo | |
impurity_measure |
Gini Twoing Ordered |
|
train_pct |
Číslo | Přednastavená prevence. |
set_random_seed |
příznak | Volba výsledků replikace. |
seed |
Číslo | |
calculate_variable_importance |
příznak | |
calculate_raw_propensities |
příznak | |
calculate_adjusted_propensities |
příznak | |
adjusted_propensity_partition |
Test Validation |