Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
TwoStep Klastr je průzkumný nástroj, který je navržen pro odhalení přirozených seskupení (nebo klastrů) v rámci datové sady, která by jinak nebyla zřejmá. Algoritmus použitý touto procedurou má několik žádoucích funkcí, které jej odlišují od tradičních metod klastrování, jako je práce s kategoriálními a spojitými proměnnými, automatický výběr počtu klastrů a škálovatelnost.
twostepAS Vlastnosti |
Hodnoty | Popis vlastnosti |
---|---|---|
inputs |
[f1 ... fN] | Modely AS TwoSteppoužívají seznam vstupních polí, ale žádný cíl. Pole Váha a frekvence nejsou rozpoznána. |
use_predefined_roles |
Logická hodnota | Výchozí =True |
use_custom_field_assignments |
Logická hodnota | Výchozí =False |
cluster_num_auto |
Logická hodnota | Výchozí =True |
min_num_clusters |
celočíselná hodnota | Výchozí =2 |
max_num_clusters |
celočíselná hodnota | Výchozí =15 |
num_clusters |
celočíselná hodnota | Výchozí =5 |
clustering_criterion |
AIC BIC |
|
automatic_clustering_method |
use_clustering_criterion_setting Distance_jump Minimum Maximum |
|
feature_importance_method |
use_clustering_criterion_setting effect_size |
|
use_random_seed |
Logická hodnota | |
random_seed |
celočíselná hodnota | |
distance_measure |
Euclidean Loglikelihood |
|
include_outlier_clusters |
Logická hodnota | Výchozí =True |
num_cases_in_feature_tree_leaf_is_less_than |
celočíselná hodnota | Výchozí =10 |
top_perc_outliers |
celočíselná hodnota | Výchozí =5 |
initial_dist_change_threshold |
celočíselná hodnota | Výchozí =0 |
leaf_node_maximum_branches |
celočíselná hodnota | Výchozí =8 |
non_leaf_node_maximum_branches |
celočíselná hodnota | Výchozí =8 |
max_tree_depth |
celočíselná hodnota | Výchozí =3 |
adjustment_weight_on_measurement_level |
celočíselná hodnota | Výchozí =6 |
memory_allocation_mb |
Číslo | Výchozí =512 |
delayed_split |
Logická hodnota | Výchozí =True |
fields_not_to_standardize |
[f1 ... fN] | |
adaptive_feature_selection |
Logická hodnota | Výchozí =True |
featureMisPercent |
celočíselná hodnota | Výchozí =70 |
coefRange |
Číslo | Výchozí =0.05 |
percCasesSingleCategory |
celočíselná hodnota | Výchozí =95 |
numCases |
celočíselná hodnota | Výchozí =24 |
include_model_specifications |
Logická hodnota | Výchozí =True |
include_record_summary |
Logická hodnota | Výchozí =True |
include_field_transformations |
Logická hodnota | Výchozí =True |
excluded_inputs |
Logická hodnota | Výchozí =True |
evaluate_model_quality |
Logická hodnota | Výchozí =True |
show_feature_importance bar chart |
Logická hodnota | Výchozí =True |
show_feature_importance_ word_cloud |
Logická hodnota | Výchozí =True |
show_outlier_clusters_interactive_table_and_chart |
Logická hodnota | Výchozí =True |
show_outlier_clusters_pivot_table |
Logická hodnota | Výchozí = True |
across_cluster_feature_importance |
Logická hodnota | Výchozí =True |
across_cluster_profiles_pivot_table |
Logická hodnota | Výchozí =True |
withinprofiles |
Logická hodnota | Výchozí =True |
cluster_distances |
Logická hodnota | Výchozí =True |
cluster_label |
String Number |
|
label_prefix |
String |
|
evaluation_maxNum |
celočíselná hodnota | Maximální počet odlehlých hodnot, které se mají zobrazit ve výstupu. Pokud existuje více než dvacet odlehlých klastrů, bude místo toho zobrazena kontingenční tabulka. |
across_cluster_profiles_table_and_chart |
Logická hodnota | Tabulka a grafy důležitosti funkcí a seskupení klastrů pro každý vstup (pole) použitý v řešení klastru. Výběrem různých řádků v tabulce se zobrazí jiný graf. U kategoriálních polí se zobrazí sloupcový graf. Pro souvislá pole se zobrazí graf středních hodnot a směrodatné odchylky. |