Torna alla versione inglese della documentazioneProprietà twostepAS
Proprietà twostepAS
Ultimo aggiornamento: 07 ott 2024
TwoStep Cluster è uno strumento di esplorazione progettato per rivelare raggruppamenti naturali (o cluster) all'interno di un dataset che altrimenti non sarebbe evidente. L'algoritmo utilizzato da questa procedura ha diverse caratteristiche desiderabili che lo differenziano dalle tecniche di clustering tradizionali, come la gestione di variabili categoriali e continue, la selezione automatica del numero di cluster e la scalabilità.
Proprietà twostepAS |
Valori | Descrizione proprietà |
---|---|---|
inputs |
[f1 ... fN] | I modelli TwoStepAS utilizzano un elenco di campi di input, ma nessun campo obiettivo. I campi peso e frequenza non vengono riconosciuti. |
use_predefined_roles |
Booleano | Valore predefinito =True |
use_custom_field_assignments |
Booleano | Valore predefinito =False |
cluster_num_auto |
Booleano | Valore predefinito =True |
min_num_clusters |
intero | Valore predefinito =2 |
max_num_clusters |
intero | Valore predefinito =15 |
num_clusters |
intero | Valore predefinito =5 |
clustering_criterion |
AIC BIC |
|
automatic_clustering_method |
use_clustering_criterion_setting Distance_jump Minimum Maximum |
|
feature_importance_method |
use_clustering_criterion_setting effect_size |
|
use_random_seed |
Booleano | |
random_seed |
intero | |
distance_measure |
Euclidean Loglikelihood |
|
include_outlier_clusters |
Booleano | Valore predefinito =True |
num_cases_in_feature_tree_leaf_is_less_than |
intero | Valore predefinito =10 |
top_perc_outliers |
intero | Valore predefinito =5 |
initial_dist_change_threshold |
intero | Valore predefinito =0 |
leaf_node_maximum_branches |
intero | Valore predefinito =8 |
non_leaf_node_maximum_branches |
intero | Valore predefinito =8 |
max_tree_depth |
intero | Valore predefinito =3 |
adjustment_weight_on_measurement_level |
intero | Valore predefinito =6 |
memory_allocation_mb |
numero | Valore predefinito =512 |
delayed_split |
Booleano | Valore predefinito =True |
fields_not_to_standardize |
[f1 ... fN] | |
adaptive_feature_selection |
Booleano | Valore predefinito =True |
featureMisPercent |
intero | Valore predefinito =70 |
coefRange |
numero | Valore predefinito =0.05 |
percCasesSingleCategory |
intero | Valore predefinito =95 |
numCases |
intero | Valore predefinito =24 |
include_model_specifications |
Booleano | Valore predefinito =True |
include_record_summary |
Booleano | Valore predefinito =True |
include_field_transformations |
Booleano | Valore predefinito =True |
excluded_inputs |
Booleano | Valore predefinito =True |
evaluate_model_quality |
Booleano | Valore predefinito =True |
show_feature_importance bar chart |
Booleano | Valore predefinito =True |
show_feature_importance_ word_cloud |
Booleano | Valore predefinito =True |
show_outlier_clusters_interactive_table_and_chart |
Booleano | Valore predefinito =True |
show_outlier_clusters_pivot_table |
Booleano | Valore predefinito=True |
across_cluster_feature_importance |
Booleano | Valore predefinito =True |
across_cluster_profiles_pivot_table |
Booleano | Valore predefinito =True |
withinprofiles |
Booleano | Valore predefinito =True |
cluster_distances |
Booleano | Valore predefinito =True |
cluster_label |
String Number |
|
label_prefix |
String |
|
evaluation_maxNum |
intero | Il numero massimo di valori anomali da visualizzare nell'output. Se vi sono più di venti cluster con valori anomali, verrà visualizzata una tabella pivot. |
across_cluster_profiles_table_and_chart |
Booleano | Tabella e grafici dell'importanza della funzione e dei centri di cluster per ogni input (campo) utilizzato nella soluzione cluster. La selezione di diverse righe nella tabella consente di visualizzare un grafico differente. Per i campi categoriali viene visualizzato un grafico a barre. Per i campi continui, viene visualizzato un grafico delle deviazioni standard e medie. |