Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12 sty 2023
Węzeł Autogrupowanie szacuje i porównuje modele skupień identyfikujące grupy rekordów o podobnej charakterystyce. Węzeł działa tak samo, jak pozostałe zautomatyzowane węzły modelowania, umożliwiając eksperymentowanie z wieloma kombinacjami opcji w pojedynczym przebiegu modelowania. Modele można porównywać, korzystając z miar bazowych, które pozwalają podejmować próby filtrowania i oceny przydatności modelu skupień oraz udostępniają miary bazujące na istotności poszczególnych zmiennych.
Przykład
node = stream.create("autocluster", "My node")
node.setPropertyValue("ranking_measure", "Silhouette")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_silhouette_limit", True)
node.setPropertyValue("silhouette_limit", 5)
Właściwości węzła autoclusternode |
Wartości | Opis właściwości |
---|---|---|
evaluation |
field (pole) | Uwaga: Tylko węzeł Auto Cluster. Określa zmienną, dla której będzie obliczana wartość ważności. Alternatywnie można użyć do określenia, jak dobrze klaster różnicuje wartość tego pola, a co za tym samym, jak dobrze model będzie przewidywać to pole.
|
ranking_measure |
Silhouette Num_clusters Size_smallest_cluster Size_largest_cluster Smallest_to_largest Importance |
|
ranking_dataset |
Training Test |
|
summary_limit |
liczba całkowita | Liczba modeli do uwzględnienia w raporcie. Liczba całkowita od 1 do 100. |
enable_silhouette_limit |
flaga | |
silhouette_limit |
liczba całkowita | Liczba całkowita od 0 do 100. |
enable_number_less_limit |
flaga | |
number_less_limit |
Liczba | Liczba rzeczywista od 0,0 do 1,0. |
enable_number_greater_limit |
flaga | |
number_greater_limit |
Liczba | Liczba całkowita większa od 0. |
enable_smallest_cluster_limit |
flaga | |
smallest_cluster_units |
Percentage Counts |
|
smallest_cluster_limit_percentage |
Liczba | |
smallest_cluster_limit_count |
liczba całkowita | Liczba całkowita większa od 0. |
enable_largest_cluster_limit |
flaga | |
largest_cluster_units |
Percentage Counts |
|
largest_cluster_limit_percentage |
Liczba | |
largest_cluster_limit_count |
liczba całkowita | |
enable_smallest_largest_limit |
flaga | |
smallest_largest_limit |
Liczba | |
enable_importance_limit |
flaga | |
importance_limit_condition |
Greater_than Less_than |
|
importance_limit_greater_than |
Liczba | Liczba całkowita od 0 do 100. |
importance_limit_less_than |
Liczba | Liczba całkowita od 0 do 100. |
<algorithm> |
flaga | Włącza lub wyłącza stosowanie konkretnego algorytmu. |
<algorithm>.<property> |
łańcuch | Ustawia wartość właściwości konkretnego algorytmu. Więcej informacji na ten temat zawiera sekcja Ustawianie właściwości algorytmu . |
number_of_models |
liczba całkowita | |
enable_model_build_time_limit |
boolean (boolowskie) | (Tylko modele K-średnich, Kohonen, TwoStep, SVM, KNN, Bayes Net i Decision List.) Ustawia maksymalny limit czasu dla każdego modelu. Na przykład, jeśli czas uczenia jednego konkretnego modelu jest nieprzewidywalny ze względu na pewne złożone interakcje, to nie chcemy, by ten model wstrzymywał cały przebieg modelowania. |
model_build_time_limit |
liczba całkowita | Czas spędzony na budowaniu modelu. |
enable_stop_after_time_limit |
boolean (boolowskie) | (Sieć neuronowa, K-średnie, Kohonen, TwoStep, SVM, KNN, Bayes Net i C & R Tree modele tylko.) Zatrzymuje działanie po określonej liczbie godzin. Wszystkie modele wygenerowane do tego czasu zostaną uwzględnione w modelu użytkowym, ale nie będą już tworzone następne modele. |
stop_after_time_limit |
double (podwójna) | Limit czasu wykonywania (godziny). |
stop_if_valid_model |
boolean (boolowskie) | Zatrzymuje uruchomienie, gdy model przekazuje wszystkie kryteria określone w ustawieniach Discard. |