Volver a la versión inglesa de la documentaciónpropiedades de twostepAS
propiedades de twostepAS
Última actualización: 07 oct 2024
TwoStep Cluster es una herramienta de exploración diseñada para revelar agrupaciones naturales (o clústeres) dentro de un conjunto de datos que de otro modo no sería aparente. El algoritmo empleado por este procedimiento tiene varias características deseables que lo diferencian de las técnicas de agrupación en clúster tradicionales, como el manejo de variables categóricas y continuas, la selección automática de número de clústeres y la escalabilidad.
Propiedades de twostepAS |
Valores | Descripción de la propiedad |
---|---|---|
inputs |
[f1 ... fN] | Los modelos bietápicos utilizan una lista de campos de entrada, pero no de objetivos. Los campos de ponderación y frecuencia no se reconocen. |
use_predefined_roles |
Boolean | Valor predeterminado=True |
use_custom_field_assignments |
Boolean | Valor predeterminado=False |
cluster_num_auto |
Boolean | Valor predeterminado=True |
min_num_clusters |
entero | Valor predeterminado=2 |
max_num_clusters |
entero | Valor predeterminado=15 |
num_clusters |
entero | Valor predeterminado=5 |
clustering_criterion |
AIC BIC |
|
automatic_clustering_method |
use_clustering_criterion_setting Distance_jump Minimum Maximum |
|
feature_importance_method |
use_clustering_criterion_setting effect_size |
|
use_random_seed |
Boolean | |
random_seed |
entero | |
distance_measure |
Euclidean Loglikelihood |
|
include_outlier_clusters |
Boolean | Valor predeterminado=True |
num_cases_in_feature_tree_leaf_is_less_than |
entero | Valor predeterminado=10 |
top_perc_outliers |
entero | Valor predeterminado=5 |
initial_dist_change_threshold |
entero | Valor predeterminado=0 |
leaf_node_maximum_branches |
entero | Valor predeterminado=8 |
non_leaf_node_maximum_branches |
entero | Valor predeterminado=8 |
max_tree_depth |
entero | Valor predeterminado=3 |
adjustment_weight_on_measurement_level |
entero | Valor predeterminado=6 |
memory_allocation_mb |
número | Valor predeterminado=512 |
delayed_split |
Booleano | Valor predeterminado=True |
fields_not_to_standardize |
[f1 ... fN] | |
adaptive_feature_selection |
Booleano | Valor predeterminado=True |
featureMisPercent |
entero | Valor predeterminado=70 |
coefRange |
número | Valor predeterminado=0.05 |
percCasesSingleCategory |
entero | Valor predeterminado=95 |
numCases |
entero | Valor predeterminado=24 |
include_model_specifications |
Booleano | Valor predeterminado=True |
include_record_summary |
Booleano | Valor predeterminado=True |
include_field_transformations |
Booleano | Valor predeterminado=True |
excluded_inputs |
Booleano | Valor predeterminado=True |
evaluate_model_quality |
Booleano | Valor predeterminado=True |
show_feature_importance bar chart |
Booleano | Valor predeterminado=True |
show_feature_importance_ word_cloud |
Booleano | Valor predeterminado=True |
show_outlier_clusters_interactive_table_and_chart |
Booleano | Valor predeterminado=True |
show_outlier_clusters_pivot_table |
Booleano | Default=True |
across_cluster_feature_importance |
Booleano | Valor predeterminado=True |
across_cluster_profiles_pivot_table |
Booleano | Valor predeterminado=True |
withinprofiles |
Boolean | Valor predeterminado=True |
cluster_distances |
Boolean | Valor predeterminado=True |
cluster_label |
String Number |
|
label_prefix |
String |
|
evaluation_maxNum |
entero | El número máximo de valores atípicos a visualizar en la salida. Si hay más de veinte clústeres de valor atípico, en su lugar se muestra una tabla dinámica. |
across_cluster_profiles_table_and_chart |
Booleano | Tabla y gráficos de importancia de característica y centros de clúster para cada entrada (campo) utilizada en la solución de clúster. Al seleccionar filas diferentes en la tabla se visualiza un gráfico distinto. En los campos categóricos se muestra un gráfico de barras. Para los campos continuos, se visualiza un gráfico de medias y desviaciones estándar. |