Retourner à la version anglaise de la documentationpropriétés de twostepAS
propriétés de twostepAS
Dernière mise à jour : 04 oct. 2024
TwoStep Cluster est un outil d'exploration conçu pour révéler des regroupements naturels (ou des clusters) au sein d'un ensemble de données qui, autrement, ne seraient pas apparents. L'algorithme utilisé par cette procédure a plusieurs caractéristiques intéressantes qui le différencient des techniques de classification traditionnelles, telles que le traitement des variables catégorielles et continues, la sélection automatique du nombre de clusters et l'évolutivité.
Propriétés twostepAS |
Valeurs | Description de la propriété |
---|---|---|
inputs |
[f1 ... fN] | Les modèles TwoStepAS utilisent une liste de champs d'entrée, mais pas de cible. Les champs de pondération et de fréquence ne sont pas reconnus. |
use_predefined_roles |
Booléen | Valeur par défaut=True |
use_custom_field_assignments |
Booléen | Valeur par défaut=False |
cluster_num_auto |
Booléen | Valeur par défaut=True |
min_num_clusters |
Integer | Valeur par défaut=2 |
max_num_clusters |
Integer | Valeur par défaut=15 |
num_clusters |
Integer | Valeur par défaut=5 |
clustering_criterion |
AIC BIC |
|
automatic_clustering_method |
use_clustering_criterion_setting Distance_jump Minimum Maximum |
|
feature_importance_method |
use_clustering_criterion_setting effect_size |
|
use_random_seed |
Booléen | |
random_seed |
Integer | |
distance_measure |
Euclidean Loglikelihood |
|
include_outlier_clusters |
Booléen | Valeur par défaut=True |
num_cases_in_feature_tree_leaf_is_less_than |
entier | Valeur par défaut=10 |
top_perc_outliers |
entier | Valeur par défaut=5 |
initial_dist_change_threshold |
entier | Valeur par défaut=0 |
leaf_node_maximum_branches |
entier | Valeur par défaut=8 |
non_leaf_node_maximum_branches |
entier | Valeur par défaut=8 |
max_tree_depth |
entier | Valeur par défaut=3 |
adjustment_weight_on_measurement_level |
Integer | Valeur par défaut=6 |
memory_allocation_mb |
number | Valeur par défaut=512 |
delayed_split |
Booléen | Valeur par défaut=True |
fields_not_to_standardize |
[f1 ... fN] | |
adaptive_feature_selection |
Booléen | Valeur par défaut=True |
featureMisPercent |
entier | Valeur par défaut=70 |
coefRange |
number | Valeur par défaut=0.05 |
percCasesSingleCategory |
entier | Valeur par défaut=95 |
numCases |
entier | Valeur par défaut=24 |
include_model_specifications |
Booléen | Valeur par défaut=True |
include_record_summary |
Booléen | Valeur par défaut=True |
include_field_transformations |
Booléen | Valeur par défaut=True |
excluded_inputs |
Booléen | Valeur par défaut=True |
evaluate_model_quality |
Booléen | Valeur par défaut=True |
show_feature_importance bar chart |
Booléen | Valeur par défaut=True |
show_feature_importance_ word_cloud |
Booléen | Valeur par défaut=True |
show_outlier_clusters_interactive_table_and_chart |
Booléen | Valeur par défaut=True |
show_outlier_clusters_pivot_table |
Booléen | Valeur par défaut = True |
across_cluster_feature_importance |
Booléen | Valeur par défaut=True |
across_cluster_profiles_pivot_table |
Booléen | Valeur par défaut=True |
withinprofiles |
Booléen | Valeur par défaut=True |
cluster_distances |
Booléen | Valeur par défaut=True |
cluster_label |
String Number |
|
label_prefix |
String |
|
evaluation_maxNum |
entier | Nombre maximal de valeurs extrêmes à afficher dans la sortie. Si le nombre de clusters de valeurs extrêmes dépasse 20, un tableau croisé sera affiché à la place. |
across_cluster_profiles_table_and_chart |
Booléen | Tableau et graphiques de l'importance des fonctions et des centres de clusters pour chaque entrée (champ) utilisée dans la solution de cluster. La sélection de lignes différentes dans le tableau affiche un graphique différent. Pour les champs catégoriels, un diagramme à barres est affiché. Pour les champs continus, un diagramme de moyennes et d'écarts type est affiché. |