Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04 lip 2023
Węzeł Klasyfikacja i regresja (C&R) generuje drzewo decyzyjne umożliwiające predykcję lub klasyfikację przyszłych obserwacji. Metoda ta korzysta z rekurencyjnego partycjonowania w celu podzielenia rekordów szkoleń na segmenty, minimalizując zanieczyszczenia na każdym kroku, gdzie węzeł w drzewie jest uważany za "czysty", jeśli 100% obserwacji w węźle przypada na konkretną kategorię zmiennej przewidywanej. Zmienne przewidywana i wejściowa mogą być zakresami liczbowymi lub jakościowymi (nominalnymi, porządkowymi lub flagami); wszystkie podziały są binarne (tylko dwie podgrupy).
Przykład
node = stream.createAt("cart", "My node", 200, 100)
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "BP", "Cholesterol"])
# "Build Options" tab, "Objective" panel
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", """Grow Node Index 0 Children 1 2
Grow Node Index 2 Children 3 4""")
# "Build Options" tab, "Basics" panel
node.setPropertyValue("prune_tree", False)
node.setPropertyValue("use_std_err_rule", True)
node.setPropertyValue("std_err_multiplier", 3.0)
node.setPropertyValue("max_surrogates", 7)
# "Build Options" tab, "Stopping Rules" panel
node.setPropertyValue("use_percentage", True)
node.setPropertyValue("min_parent_records_pc", 5)
node.setPropertyValue("min_child_records_pc", 3)
# "Build Options" tab, "Advanced" panel
node.setPropertyValue("min_impurity", 0.0003)
node.setPropertyValue("impurity_measure", "Twoing")
# "Model Options" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Cart_Drug")
Właściwości węzła cartnode |
Wartości | Opis właściwości |
---|---|---|
target |
field (pole) | Modele C&R Tree używają jednej zmiennej przewidywanej i co najmniej jednej zmiennej wejściowej. Można też określić zmienną częstości. Więcej informacji można znaleźć w temacie Wspólne właściwości węzła modelowania . |
continue_training_existing_model |
Flaga | |
objective |
Standard Boosting Bagging psm |
Wartość psm jest używana w przypadku bardzo dużych zbiorów danych i wymaga połączenia z serwerem. |
model_output_type |
Single InteractiveBuilder |
|
use_tree_directives |
Flaga | |
tree_directives |
łańcuch | Określ dyrektywy rozrostu drzewa. Dyrektywy można ujmować w potrójne cudzysłowy, aby uniknąć poprzedzania znaków nowego wiersza lub cudzysłowów znakami zmiany znaczenia. Uwaga: dyrektywy mogą być silnie wrażliwe na drobne zmiany w danych lub opcjach modelowania i mogą nie nadawać się do stosowania z innymi zbiorami danych. |
use_max_depth |
Default Custom |
|
max_depth |
liczba całkowita | Maksymalna głębokość drzewa, od 0 do 1000. Używane tylko wtedy, gdy use_max_depth
= Custom . |
prune_tree |
Flaga | Przytnij drzewo, aby uniknąć przeuczenia. |
use_std_err |
Flaga | Użyj maksymalnej różnicy w ryzyku (w błędach standardowych). |
std_err_multiplier |
Liczba | Maksymalna różnica. |
max_surrogates |
Liczba | Maksymalna liczba substytutów. |
use_percentage |
Flaga | |
min_parent_records_pc |
Liczba | |
min_child_records_pc |
Liczba | |
min_parent_records_abs |
Liczba | |
min_child_records_abs |
Liczba | |
use_costs |
Flaga | |
costs |
ustrukturyzowane | Właściwość ustrukturyzowana. |
priors |
Data Equal Custom |
|
custom_priors |
ustrukturyzowane | Właściwość ustrukturyzowana. |
adjust_priors |
Flaga | |
trails |
Liczba | Liczba modeli zespolonych dla boostingu i/lub agregacji bootstrapowej. |
set_ensemble_method |
Voting HighestProbability HighestMeanProbability |
Domyślna reguła zespolenia dla przewidywanych zmiennych jakościowych. |
range_ensemble_method |
Mean Median |
Domyślna reguła zespolenia dla docelowych wartości ilościowych. |
large_boost |
Flaga | Zastosuj wzmocnienie do bardzo dużych zbiorów danych. |
min_impurity |
Liczba | |
impurity_measure |
Gini Twoing Ordered |
|
train_pct |
Liczba | Zbiór zabezpieczający przed przeuczeniem. |
set_random_seed |
Flaga | Opcja replikacji wyników. |
seed |
Liczba | |
calculate_variable_importance |
Flaga | |
calculate_raw_propensities |
Flaga | |
calculate_adjusted_propensities |
Flaga | |
adjusted_propensity_partition |
Test Validation |