TwoStep AS, Eigenschaften

Letzte Aktualisierung: 11. Feb. 2025
TwoStep AS, Eigenschaften

Symbol für Two-Step-AS-KnotenTwoStep Cluster ist ein Explorationstool, mit dem natürliche Gruppierungen (oder Cluster) in einem Dataset sichtbar gemacht werden, die andernfalls nicht erkennbar wären. Der Algorithmus, der von dieser Prozedur verwendet wird, verfügt über mehrere wünschenswerte Funktionen, die ihn von traditionellen Clustering-Verfahren unterscheiden, wie z. B. die Handhabung von kategorialen und fortlaufenden Variablen, automatische Auswahl der Anzahl von Clustern und Skalierbarkeit.

Tabelle 1. twostepAS -Eigenschaften
twostepASEigenschaften Werte Eigenschaftsbeschreibung
inputs [f1 ... fN] TwoStepAS-Modelle verwenden eine Liste mit Eingabefeldern, jedoch kein Ziel. Gewichtungs- und Häufigkeitsfelder werden nicht erkannt.
use_predefined_roles Boolesch Standardwert=True
use_custom_field_assignments Boolesch Standardwert=False
cluster_num_auto Boolesch Standardwert=True
min_num_clusters Ganze Zahl Standardwert=2
max_num_clusters Ganze Zahl Standardwert=15
num_clusters Ganze Zahl Standardwert=5
clustering_criterion
AIC
BIC
 
automatic_clustering_method
use_clustering_criterion_setting
Distance_jump
Minimum
Maximum
 
feature_importance_method
use_clustering_criterion_setting
effect_size
 
use_random_seed Boolesch  
random_seed Ganze Zahl  
distance_measure
Euclidean
Loglikelihood
 
include_outlier_clusters Boolesch Standardwert=True
num_cases_in_feature_tree_leaf_is_less_than Integer Standardwert=10
top_perc_outliers Integer Standardwert=5
initial_dist_change_threshold Integer Standardwert=0
leaf_node_maximum_branches Integer Standardwert=8
non_leaf_node_maximum_branches Integer Standardwert=8
max_tree_depth Integer Standardwert=3
adjustment_weight_on_measurement_level Ganze Zahl Standardwert=6
memory_allocation_mb Zahl Standardwert=512
delayed_split Boolesch Standardwert=True
fields_not_to_standardize [f1 ... fN]  
adaptive_feature_selection Boolesch Standardwert=True
featureMisPercent Integer Standardwert=70
coefRange Zahl Standardwert=0.05
percCasesSingleCategory Integer Standardwert=95
numCases Integer Standardwert=24
include_model_specifications Boolesch Standardwert=True
include_record_summary Boolesch Standardwert=True
include_field_transformations Boolesch Standardwert=True
excluded_inputs Boolesch Standardwert=True
evaluate_model_quality Boolesch Standardwert=True
show_feature_importance bar chart Boolesch Standardwert=True
show_feature_importance_ word_cloud Boolesch Standardwert=True
show_outlier_clusters_interactive_table_and_chart Boolesch Standardwert=True
show_outlier_clusters_pivot_table Boolesch Standard=True
across_cluster_feature_importance Boolesch Standardwert=True
across_cluster_profiles_pivot_table Boolesch Standardwert=True
withinprofiles Boolesch Standardwert=True
cluster_distances Boolesch Standardwert=True
cluster_label
String
Number
 
label_prefix String  
evaluation_maxNum Integer Die maximale Anzahl der Ausreißer, die in der Ausgabe angezeigt werden sollen. Wenn es mehr als 20 Ausreißercluster gibt, wird stattdessen eine Pivot-Tabelle angezeigt.
across_cluster_profiles_table_and_chart Boolesch Tabelle und Diagramme der Merkmalbedeutung und Clusterzentren für jede Eingabe (Feld) in der Clusterlösung. Durch die Auswahl unterschiedlicher Zeilen in der Tabelle werden unterschiedliche Diagramme angezeigt. Bei kategorialen Felder wird ein Balkendiagramm angezeigt. Bei stetigen Feldern wird ein Diagramm der Mittelwerte und Standardabweichungen angezeigt.