Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12 sty 2023
Dwustopniowe grupowanie jest narzędziem eksploracyjnym, które zaprojektowano w celu ujawnienia naturalnych ugrupowań (lub klastrów) w zestawie danych, które w przeciwnym razie nie byłyby widoczne. Algorytm, który jest zastosowany w tej procedurze, ma kilka pożądanych cech, które odróżniają go od tradycyjnych technik grupowania, takich jak obsługa zmiennych jakościowych i ilościowych, automatyczny wybór liczby skupień oraz skalowalność.
Właściwości węzła twostepAS |
Wartości | Opis właściwości |
---|---|---|
inputs |
[f1 ... fN] | Modele Dwustopniowa analiza skupień korzystają z listy zmiennych wejściowych, ale nie mają zmiennych przewidywanych. Zmienne wagi i częstości nie są rozpoznawane. |
use_predefined_roles |
Wartość boolowska | Wartość domyślna =True |
use_custom_field_assignments |
Wartość boolowska | Wartość domyślna =False |
cluster_num_auto |
Wartość boolowska | Wartość domyślna =True |
min_num_clusters |
liczba całkowita | Wartość domyślna =2 |
max_num_clusters |
liczba całkowita | Wartość domyślna =15 |
num_clusters |
liczba całkowita | Wartość domyślna =5 |
clustering_criterion |
AIC BIC |
|
automatic_clustering_method |
use_clustering_criterion_setting Distance_jump Minimum Maximum |
|
feature_importance_method |
use_clustering_criterion_setting effect_size |
|
use_random_seed |
Wartość boolowska | |
random_seed |
liczba całkowita | |
distance_measure |
Euclidean Loglikelihood |
|
include_outlier_clusters |
Wartość boolowska | Wartość domyślna =True |
num_cases_in_feature_tree_leaf_is_less_than |
liczba całkowita | Wartość domyślna =10 |
top_perc_outliers |
liczba całkowita | Wartość domyślna =5 |
initial_dist_change_threshold |
liczba całkowita | Wartość domyślna =0 |
leaf_node_maximum_branches |
liczba całkowita | Wartość domyślna =8 |
non_leaf_node_maximum_branches |
liczba całkowita | Wartość domyślna =8 |
max_tree_depth |
liczba całkowita | Wartość domyślna =3 |
adjustment_weight_on_measurement_level |
liczba całkowita | Wartość domyślna =6 |
memory_allocation_mb |
Liczba | Wartość domyślna =512 |
delayed_split |
Wartość boolowska | Wartość domyślna =True |
fields_not_to_standardize |
[f1 ... fN] | |
adaptive_feature_selection |
Wartość boolowska | Wartość domyślna =True |
featureMisPercent |
liczba całkowita | Wartość domyślna =70 |
coefRange |
Liczba | Wartość domyślna =0.05 |
percCasesSingleCategory |
liczba całkowita | Wartość domyślna =95 |
numCases |
liczba całkowita | Wartość domyślna =24 |
include_model_specifications |
Wartość boolowska | Wartość domyślna =True |
include_record_summary |
Wartość boolowska | Wartość domyślna =True |
include_field_transformations |
Wartość boolowska | Wartość domyślna =True |
excluded_inputs |
Wartość boolowska | Wartość domyślna =True |
evaluate_model_quality |
Wartość boolowska | Wartość domyślna =True |
show_feature_importance bar chart |
Wartość boolowska | Wartość domyślna =True |
show_feature_importance_ word_cloud |
Wartość boolowska | Wartość domyślna =True |
show_outlier_clusters_interactive_table_and_chart |
Wartość boolowska | Wartość domyślna =True |
show_outlier_clusters_pivot_table |
Wartość boolowska | Domyślnie=True |
across_cluster_feature_importance |
Wartość boolowska | Wartość domyślna =True |
across_cluster_profiles_pivot_table |
Wartość boolowska | Wartość domyślna =True |
withinprofiles |
Wartość boolowska | Wartość domyślna =True |
cluster_distances |
Wartość boolowska | Wartość domyślna =True |
cluster_label |
String Number |
|
label_prefix |
String |
|
evaluation_maxNum |
liczba całkowita | Maksymalna liczba skupień odstających, która może być ujęta w wynikach. Jeśli liczba skupień odstających przekracza dwadzieścia, to zostanie wyświetlona tabela przestawna. |
across_cluster_profiles_table_and_chart |
Wartość boolowska | Tabela i wykresy ważności predyktorów oraz środków skupień dla każdej zmiennej wejściowej używanej w rozwiązaniu dla skupień. Wybieranie różnych wierszy w tabeli powoduje wyświetlanie różnych wykresów. W przypadku zmiennych jakościowych wyświetlany będzie wykres słupkowy. W przypadku zmiennych ilościowych wyświetlany będzie wykres średnich i odchyleń standardowych. |