Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12 sty 2023
Węzeł Auto Predykcja estymuje i porównuje modele zwracające wyniki w formie ciągłego przedziału liczbowego, korzystając z szeregu różnych metod. Węzeł działa tak samo, jak węzeł Auto Klasyfikacja, umożliwiając użytkownikowi wybór używanych algorytmów oraz eksperymentowanie z wieloma kombinacjami opcji w pojedynczym przebiegu modelowania. Obsługiwane algorytmy obejmują sieci neuronowe, drzewo C&R, CHAID, regresję liniową, uogólnioną regresję liniową oraz algorytmy SVM. Modele można porównywać na podstawie korelacji, błędu względnego lub liczby używanych zmiennych.
Przykład
node = stream.create("autonumeric", "My node")
node.setPropertyValue("ranking_measure", "Correlation")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_correlation_limit", True)
node.setPropertyValue("correlation_limit", 0.8)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("neuralnetwork", True)
node.setPropertyValue("chaid", False)
Właściwości węzła autonumericnode |
Wartości | Opis właściwości |
---|---|---|
custom_fields |
flaga | Wartość True powoduje, że zamiast ustawień węzła Typ używane będą niestandardowe ustawienia zmiennych. |
target |
field (pole) | Węzeł Auto Predykcja wymaga jednej zmiennej przewidywanej i co najmniej jednej zmiennej wejściowej. Można też określić zmienne wagi i częstości. Więcej informacji na ten temat zawiera sekcja Właściwości wspólnego węzła modelowania . |
inputs |
[field1 … field2] | |
partition |
field (pole) | |
use_frequency |
flaga | |
frequency_field |
field (pole) | |
use_weight |
flaga | |
weight_field |
field (pole) | |
use_partitioned_data |
flaga | Jeśli pole partycji jest zdefiniowane, do budowania modelu używane są tylko dane uczących. |
ranking_measure |
Correlation NumberOfFields |
|
ranking_dataset |
Test Training |
|
number_of_models |
liczba całkowita | Liczba modeli do uwzględnienia w modelu użytkowym. Liczba całkowita od 1 do 100. |
calculate_variable_importance |
flaga | |
enable_correlation_limit |
flaga | |
correlation_limit |
liczba całkowita | |
enable_number_of_fields_limit |
flaga | |
number_of_fields_limit |
liczba całkowita | |
enable_relative_error_limit |
flaga | |
relative_error_limit |
liczba całkowita | |
enable_model_build_time_limit |
flaga | |
model_build_time_limit |
liczba całkowita | |
enable_stop_after_time_limit |
flaga | |
stop_after_time_limit |
liczba całkowita | |
stop_if_valid_model |
flaga | |
<algorithm> |
flaga | Włącza lub wyłącza stosowanie konkretnego algorytmu. |
<algorithm>.<property> |
łańcuch | Ustawia wartość właściwości konkretnego algorytmu. Więcej informacji na ten temat zawiera sekcja Ustawianie właściwości algorytmu . |
use_cross_validation |
boolean (boolowskie) | Zamiast korzystać z pojedynczej partycji, używana jest partycja sprawdzania krzyżowego. |
number_of_folds |
liczba całkowita | N fold parametr dla walidacji krzyżowej, z zakresu od 3 do 10. |
set_random_seed |
boolean (boolowskie) | Ustawienie wartości początkowej generatora liczb losowych umożliwia powielenie analizy. Podaj liczbę całkowitą lub kliknij przycisk Generuj, co spowoduje utworzenie pseudolosowej liczby całkowitej między 1 a 2147483647, włącznie. Domyślnie analizy są replikowane z wartością startową generatora 229176228. |
random_seed |
liczba całkowita | Wartość początkowa |
filter_individual_model_output |
boolean (boolowskie) | Usuwa z danych wynikowych wszystkie dodatkowe zmienne wygenerowane przez poszczególne modele zasilające węzeł zespolenia. Wybierz tę opcję, jeśli interesujesz się tylko połączonym wynikiem ze wszystkich modeli wejściowych. Upewnij się, że ta opcja nie jest zaznaczona, jeśli na przykład chcesz użyć trybu Analiza lub Ewaluacja do porównania dokładności oceny zespolonej z oceną poszczególnych modeli wejściowych. |
calculate_standard_error |
boolean (boolowskie) | W przypadku zmiennej przewidywanej ilościowej (zakres liczbowy) standardowe obliczenie błędu jest uruchamiane domyślnie w celu obliczenia różnicy między wartościami zmierzonymi lub szacowanymi a wartościami prawdziwymi, a także w celu pokazania, w jaki sposób porównywane są te wartości szacunkowe. |