Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04 lip 2023
Węzeł Drzewo-AS jest podobny do węzła CHAID; jednak węzeł Drzewo-AS jest przeznaczony do przetwarzania wielkich zbiorów danych w celu utworzenia pojedynczego drzewa i wyświetla model wynikowy w przeglądarce wyników. Węzeł generuje drzewo decyzyjne używając statystyki chi-kwadrat (CHAID), aby określić optymalne podziały. CHAID może generować drzewa niebinarne, co oznacza, że niektóre podziały mają więcej niż dwie gałęzie. Zmienne przewidywana i wejściowa mogą być zakresami liczbowymi (ciągłymi) lub jakościowymi. Wyczerpujący CHAID stanowi modyfikację CHAID umożliwiającą dokładniejsze badanie wszystkich możliwych podziałów, lecz obliczenia w jego przypadku zajmują więcej czasu.
Właściwości węzła treeas |
Wartości | Opis właściwości |
---|---|---|
target |
field (pole) | W węźle Drzewo-AS modele CHAID wymagają jednej zmiennej przewidywanej i co najmniej jednej zmiennej wejściowej. Można też określić zmienną częstości. Więcej informacji na ten temat zawiera sekcja Właściwości wspólnego węzła modelowania . |
method |
chaid exhaustive_chaid |
|
max_depth |
liczba całkowita | Maksymalna głębokość drzewa, od 0 do 20. Wartość domyślna to 5. |
num_bins |
liczba całkowita | Używana tylko wtedy, gdy dane wejściowe są złożone ze zmiennych ciągłych. Określa liczbę przedziałów o równej częstości, na którą mają być podzielone dane wejściowe; dostępne opcje: 2, 4, 5, 10, 20, 25, 50 i 100. |
record_threshold |
liczba całkowita | Liczba rekordów, przy której podczas budowania drzewa model przełączy się ze stosowania wartości p na wielkości efektu. Wartość domyślna to 1 000 000; można ją zwiększać lub zmniejszać z krokiem 10 000. |
split_alpha |
Liczba | Poziom istotności dla podziałów. Wartość musi mieścić się w przedziale od 0,01 do 0,99. |
merge_alpha |
Liczba | Poziom istotności dla łączenia. Wartość musi mieścić się w przedziale od 0,01 do 0,99. |
bonferroni_adjustment |
Flaga | Koryguj wartości istotności metodą Bonferroni. |
effect_size_threshold_cont |
Liczba | Określa próg wielkości efektów obowiązujący podczas podziału węzłów i łączenia kategorii w przypadku używania ilościowej zmiennej przewidywanej. Wartość musi mieścić się w przedziale od 0,01 do 0,99. |
effect_size_threshold_cat |
Liczba | Określa próg wielkości efektów obowiązujący podczas podziału węzłów i łączenia kategorii w przypadku używania jakościowej zmiennej przewidywanej. Wartość musi mieścić się w przedziale od 0,01 do 0,99. |
split_merged_categories |
Flaga | Zezwalaj na ponowny podział połączonych kategorii. |
grouping_sig_level |
Liczba | Służy do określania sposobu tworzenia grup węzłów lub rozpoznawania nietypowych węzłów. |
chi_square |
pearson likelihood_ratio |
Metoda obliczania statystyki chi-kwadrat: Pearsona albo iloraz wiarygodności |
minimum_record_use |
use_percentage use_absolute |
|
min_parent_records_pc |
Liczba | Wartością domyślną jest 2. Minimum 1, maksimum 100, z przyrostem co 1. Wartość gałęzi nadrzędnej musi być wyższa niż gałąź podrzędna. |
min_child_records_pc |
Liczba | Wartością domyślną jest 1. Minimum 1, maksimum 100, z przyrostem co 1. |
min_parent_records_abs |
Liczba | Wartość domyślna to 100. Minimum 1, maksimum 100, z przyrostem co 1. Wartość gałęzi nadrzędnej musi być wyższa niż gałąź podrzędna. |
min_child_records_abs |
Liczba | Wartość domyślna to 50. Minimum 1, maksimum 100, z przyrostem co 1. |
epsilon |
Liczba | Minimalna zmiana oczekiwanych częstości komórek. |
max_iterations |
Liczba | Maksimum iteracji dla uzyskania zbieżności. |
use_costs |
Flaga | |
costs |
ustrukturyzowane | Właściwość ustrukturyzowana. Obowiązujący format to lista złożona z 3 wartości: wartości rzeczywistej, wartości przewidywanej i kosztu, gdyby ta predykcja była błędna. Na przykład:tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY",
4.0]]) |
default_cost_increase |
none linear square custom |
włączona tylko w przypadku porządkowych zmiennych przewidywanych. Określa wartości domyślne w macierzy kosztów. |
calculate_conf |
Flaga | |
display_rule_id |
Flaga | Dodaje do wyników oceniania zmienną określającą identyfikator węzła końcowego, do którego przypisany jest każdy rekord. |