0 / 0
Go back to the English version of the documentation
Vlastnosti twostepAS
Last updated: 04. 7. 2023
Vlastnosti twostepAS

Ikona uzlu Twhost-ASTwoStep Klastr je průzkumný nástroj, který je navržen pro odhalení přirozených seskupení (nebo klastrů) v rámci datové sady, která by jinak nebyla zřejmá. Algoritmus použitý touto procedurou má několik žádoucích funkcí, které jej odlišují od tradičních metod klastrování, jako je práce s kategoriálními a spojitými proměnnými, automatický výběr počtu klastrů a škálovatelnost.

Tabulka 1. Vlastnosti twostepAS
twostepAS Vlastnosti Hodnoty Popis vlastnosti
inputs [f1 ... fN] Modely AS TwoSteppoužívají seznam vstupních polí, ale žádný cíl. Pole Váha a frekvence nejsou rozpoznána.
use_predefined_roles Logická hodnota Výchozí =True
use_custom_field_assignments Logická hodnota Výchozí =False
cluster_num_auto Logická hodnota Výchozí =True
min_num_clusters celočíselná hodnota Výchozí =2
max_num_clusters celočíselná hodnota Výchozí =15
num_clusters celočíselná hodnota Výchozí =5
clustering_criterion
AIC
BIC
 
automatic_clustering_method
use_clustering_criterion_setting
Distance_jump
Minimum
Maximum
 
feature_importance_method
use_clustering_criterion_setting
effect_size
 
use_random_seed Logická hodnota  
random_seed celočíselná hodnota  
distance_measure
Euclidean
Loglikelihood
 
include_outlier_clusters Logická hodnota Výchozí =True
num_cases_in_feature_tree_leaf_is_less_than celočíselná hodnota Výchozí =10
top_perc_outliers celočíselná hodnota Výchozí =5
initial_dist_change_threshold celočíselná hodnota Výchozí =0
leaf_node_maximum_branches celočíselná hodnota Výchozí =8
non_leaf_node_maximum_branches celočíselná hodnota Výchozí =8
max_tree_depth celočíselná hodnota Výchozí =3
adjustment_weight_on_measurement_level celočíselná hodnota Výchozí =6
memory_allocation_mb Číslo Výchozí =512
delayed_split Logická hodnota Výchozí =True
fields_not_to_standardize [f1 ... fN]  
adaptive_feature_selection Logická hodnota Výchozí =True
featureMisPercent celočíselná hodnota Výchozí =70
coefRange Číslo Výchozí =0.05
percCasesSingleCategory celočíselná hodnota Výchozí =95
numCases celočíselná hodnota Výchozí =24
include_model_specifications Logická hodnota Výchozí =True
include_record_summary Logická hodnota Výchozí =True
include_field_transformations Logická hodnota Výchozí =True
excluded_inputs Logická hodnota Výchozí =True
evaluate_model_quality Logická hodnota Výchozí =True
show_feature_importance bar chart Logická hodnota Výchozí =True
show_feature_importance_ word_cloud Logická hodnota Výchozí =True
show_outlier_clusters_interactive_table_and_chart Logická hodnota Výchozí =True
show_outlier_clusters_pivot_table Logická hodnota Výchozí = True
across_cluster_feature_importance Logická hodnota Výchozí =True
across_cluster_profiles_pivot_table Logická hodnota Výchozí =True
withinprofiles Logická hodnota Výchozí =True
cluster_distances Logická hodnota Výchozí =True
cluster_label
String
Number
 
label_prefix String  
evaluation_maxNum celočíselná hodnota Maximální počet odlehlých hodnot, které se mají zobrazit ve výstupu. Pokud existuje více než dvacet odlehlých klastrů, bude místo toho zobrazena kontingenční tabulka.
across_cluster_profiles_table_and_chart Logická hodnota Tabulka a grafy důležitosti funkcí a seskupení klastrů pro každý vstup (pole) použitý v řešení klastru. Výběrem různých řádků v tabulce se zobrazí jiný graf. U kategoriálních polí se zobrazí sloupcový graf. Pro souvislá pole se zobrazí graf středních hodnot a směrodatné odchylky.
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more