Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12 sty 2023
Węzeł Auto Klasyfikacja tworzy i porównuje różne modele pod kątem wyników binarnych (tak lub nie, odejścia lub brak odejścia itd.), umożliwiając użytkownikowi wybór optymalnego podejścia do danej analizy. Obsługiwana jest pewna liczba algorytmów modelowania, co umożliwia wybór metod, które mają zostać użyte, konkretnych opcji dla każdej z nich oraz kryteriów porównywania wyników. Węzeł generuje zestaw modeli w oparciu o określone opcje i nadaje rangi najlepszym kandydatom wybranym według wskazanych kryteriów.
Przykład
node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)
Właściwości węzła autoclassifiernode |
Wartości | Opis właściwości |
---|---|---|
target |
field (pole) | W przypadku zmiennych przewidywanych typu flaga węzeł Auto Klasyfikacja wymaga jednej zmiennej przewidywanej i co najmniej jednej zmiennej wejściowej. Można też określić zmienne wagi i częstości. Więcej informacji na ten temat zawiera sekcja Właściwości wspólnego węzła modelowania . |
ranking_measure |
Accuracy Area_under_curve Profit Lift Num_variables |
|
ranking_dataset |
Training Test |
|
number_of_models |
liczba całkowita | Liczba modeli do uwzględnienia w modelu użytkowym. Liczba całkowita od 1 do 100. |
calculate_variable_importance |
flaga | |
enable_accuracy_limit |
flaga | |
accuracy_limit |
liczba całkowita | Liczba całkowita od 0 do 100. |
enable_area_under_curve_limit |
flaga | |
area_under_curve_limit |
Liczba | Liczba rzeczywista od 0,0 do 1,0. |
enable_profit_limit |
flaga | |
profit_limit |
Liczba | Liczba całkowita większa od 0. |
enable_lift_limit |
flaga | |
lift_limit |
Liczba | Liczba rzeczywista większa od 1,0. |
enable_number_of_variables_limit |
flaga | |
number_of_variables_limit |
Liczba | Liczba całkowita większa od 0. |
use_fixed_cost |
flaga | |
fixed_cost |
Liczba | Liczba rzeczywista większa od 0,0. |
variable_cost |
field (pole) | |
use_fixed_revenue |
flaga | |
fixed_revenue |
Liczba | Liczba rzeczywista większa od 0,0. |
variable_revenue |
field (pole) | |
use_fixed_weight |
flaga | |
fixed_weight |
Liczba | Liczba rzeczywista większa od 0.0 |
variable_weight |
field (pole) | |
lift_percentile |
Liczba | Liczba całkowita od 0 do 100. |
enable_model_build_time_limit |
flaga | |
model_build_time_limit |
Liczba | Liczba (całkowita) minut ograniczająca czas budowania jednego modelu. |
enable_stop_after_time_limit |
flaga | |
stop_after_time_limit |
Liczba | Liczba (rzeczywista) godzin ograniczająca łączny czas działania automatycznego klasyfikatora. |
enable_stop_after_valid_model_produced |
flaga | |
use_costs |
flaga | |
<algorithm> |
flaga | Włącza lub wyłącza stosowanie konkretnego algorytmu. |
<algorithm>.<property> |
łańcuch | Ustawia wartość właściwości konkretnego algorytmu. Więcej informacji na ten temat zawiera sekcja Ustawianie właściwości algorytmu . |
use_cross_validation |
field (pole) | Zmienne dodane do tej listy mogą przyjmować rolę warunku lub predykcji w regułach generowanych przez model. Ten proces odbywa się osobno dla poszczególnych reguł, dlatego zmienna może być warunkiem w jednej roli i predykcją w innej. |
number_of_folds |
liczba całkowita | N fold parametr dla walidacji krzyżowej, z zakresu od 3 do 10. |
set_random_seed |
boolean (boolowskie) | Ustawienie wartości początkowej generatora liczb losowych umożliwia powielenie analizy. Podaj liczbę całkowitą lub kliknij przycisk Generuj, co spowoduje utworzenie pseudolosowej liczby całkowitej między 1 a 2147483647, włącznie. Domyślnie analizy są replikowane z wartością startową generatora 229176228. |
random_seed |
liczba całkowita | Wartość początkowa |
stop_if_valid_model |
boolean (boolowskie) | |
filter_individual_model_output |
boolean (boolowskie) | Usuwa z danych wynikowych wszystkie dodatkowe zmienne wygenerowane przez poszczególne modele zasilające węzeł zespolenia. Wybierz tę opcję, jeśli interesujesz się tylko połączonym wynikiem ze wszystkich modeli wejściowych. Upewnij się, że ta opcja jest niezaznaczona, jeśli na przykład ma być używany węzeł analizy lub węzeł ewaluacji w celu porównania dokładności wyniku połączonego z dokładnością do poszczególnych modeli wejściowych. |
set_ensemble_method |
"Voting" |
Metoda zespolenia dla ustawionych celów. |
set_voting_tie_selection |
"Random" |
Jeśli głosowanie jest powiązane, wybierz wartość losowo lub korzystając z najwyższej ufności. |
flag_ensemble_method |
"Voting" |
Metoda ensemble dla zmiennych przewidywanych typu flaga. |
flag_voting_tie_selection |
"Random" |
Jeśli głosowanie jest związane, wybierz wartość losowo, z najwyższym zaufaniem, lub z surowym skłonnością. |