Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12 sty 2023
Węzeł QUEST oferuje metodę klasyfikacji binarnej służącą do budowania drzew decyzyjnych, zaprojektowaną w celu redukcji czasu przetwarzania analiz dużych drzew decyzyjnych C&R, a jednocześnie w celu redukcji tendencji obecnej w metodach drzew klasyfikacji do preferowania danych wejściowych dopuszczających więcej podziałów. Zmienne wejściowe mogą być zakresami liczbowymi (ciągłymi), lecz zmienna przewidywana musi być jakościowa. Wszystkie podziały są binarne.
Przykład
node = stream.create("quest", "My node")
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "Na", "K", "Cholesterol", "BP"])
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("max_surrogates", 5)
node.setPropertyValue("split_alpha", 0.03)
node.setPropertyValue("use_percentage", False)
node.setPropertyValue("min_parent_records_abs", 40)
node.setPropertyValue("min_child_records_abs", 30)
node.setPropertyValue("prune_tree", True)
node.setPropertyValue("use_std_err", True)
node.setPropertyValue("std_err_multiplier", 3)
Właściwości węzła questnode |
Wartości | Opis właściwości |
---|---|---|
target |
field (pole) | Modele QUEST wymagają jednej zmiennej przewidywanej i co najmniej jednej zmiennej wejściowej. Można też określić zmienną częstości. Więcej informacji na ten temat zawiera sekcja Właściwości wspólnego węzła modelowania . |
continue_training_existing_model |
flaga | |
objective |
Standard Boosting Bagging psm |
Wartość psm jest używana w przypadku bardzo dużych zbiorów danych i wymaga połączenia z serwerem. |
model_output_type |
Single InteractiveBuilder |
|
use_tree_directives |
flaga | |
tree_directives |
łańcuch | |
use_max_depth |
Default Custom |
|
max_depth |
liczba całkowita | Maksymalna głębokość drzewa, od 0 do 1000. Używane tylko wtedy, gdy use_max_depth =
Custom . |
prune_tree |
flaga | Przytnij drzewo, aby uniknąć przeuczenia. |
use_std_err |
flaga | Użyj maksymalnej różnicy w ryzyku (w błędach standardowych). |
std_err_multiplier |
Liczba | Maksymalna różnica. |
max_surrogates |
Liczba | Maksymalna liczba substytutów. |
use_percentage |
flaga | |
min_parent_records_pc |
Liczba | |
min_child_records_pc |
Liczba | |
min_parent_records_abs |
Liczba | |
min_child_records_abs |
Liczba | |
use_costs |
flaga | |
costs |
ustrukturyzowane | Właściwość ustrukturyzowana. |
priors |
Data Equal Custom |
|
custom_priors |
ustrukturyzowane | Właściwość ustrukturyzowana. |
adjust_priors |
flaga | |
trails |
Liczba | Liczba modeli zespolonych dla boostingu i/lub agregacji bootstrapowej. |
set_ensemble_method |
Voting HighestProbability HighestMeanProbability |
Domyślna reguła zespolenia dla przewidywanych zmiennych jakościowych. |
range_ensemble_method |
Mean Median |
Domyślna reguła zespolenia dla docelowych wartości ilościowych. |
large_boost |
flaga | Zastosuj wzmocnienie do bardzo dużych zbiorów danych. |
split_alpha |
Liczba | Poziom istotności dla podziałów. |
train_pct |
Liczba | Zbiór zabezpieczający przed przeuczeniem. |
set_random_seed |
flaga | Opcja replikacji wyników. |
seed |
Liczba | |
calculate_variable_importance |
flaga | |
calculate_raw_propensities |
flaga | |
calculate_adjusted_propensities |
flaga | |
adjusted_propensity_partition |
Test Validation |