Volver a la versión inglesa de la documentaciónpropiedades de autoclusternode
propiedades de autoclusternode
Última actualización: 04 oct 2024
El nodo Agrupación en clústeres automática calcula y compara los modelos de agrupación en clústeres que identifican grupos de registros con características similares. El nodo funciona de la misma manera que otros nodos de modelado automático, permitiéndole experimentar con múltiples combinaciones de opciones en una única pasada de modelado. Los modelos se pueden comparar utilizando medidas básicas con las que se intenta filtrar y definir la utilidad de los modelos de clúster y proporcionar una medida según la importancia de campos concretos.
Ejemplo
node = stream.create("autocluster", "My node")
node.setPropertyValue("ranking_measure", "Silhouette")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_silhouette_limit", True)
node.setPropertyValue("silhouette_limit", 5)
Propiedades de autoclusternode |
Valores | Descripción de la propiedad |
---|---|---|
evaluation |
campo | Nota: Solo el nodo Clúster automático. Identifica el campo cuyo valor de importancia se calculará. Alternativamente, se puede utilizar para identificar cómo el clúster diferencia el valor de este campo y, por lo tanto, cómo predecirá el modelo este campo.
|
ranking_measure |
Silhouette Num_clusters Size_smallest_cluster Size_largest_cluster Smallest_to_largest Importance |
|
ranking_dataset |
Training Test |
|
summary_limit |
entero | Número de modelos que se incluirán en el informe. Especifique un entero entre 1 y 100. |
enable_silhouette_limit |
distintivo | |
silhouette_limit |
entero | Entero entre 0 y 100. |
enable_number_less_limit |
distintivo | |
number_less_limit |
número | Número real entre 0,0 y 1,0. |
enable_number_greater_limit |
distintivo | |
number_greater_limit |
número | Entero mayor que 0. |
enable_smallest_cluster_limit |
distintivo | |
smallest_cluster_units |
Percentage Counts |
|
smallest_cluster_limit_percentage |
número | |
smallest_cluster_limit_count |
entero | Entero mayor que 0. |
enable_largest_cluster_limit |
distintivo | |
largest_cluster_units |
Percentage Counts |
|
largest_cluster_limit_percentage |
número | |
largest_cluster_limit_count |
entero | |
enable_smallest_largest_limit |
distintivo | |
smallest_largest_limit |
número | |
enable_importance_limit |
distintivo | |
importance_limit_condition |
Greater_than Less_than |
|
importance_limit_greater_than |
número | Entero entre 0 y 100. |
importance_limit_less_than |
número | Entero entre 0 y 100. |
<algorithm> |
distintivo | Activa o desactiva el uso de un determinado algoritmo. |
<algorithm>.<property> |
serie | Define un valor de propiedad para un algoritmo específico. Consulte Establecimiento de propiedades de algoritmo para obtener más información. |
number_of_models |
entero | |
enable_model_build_time_limit |
Boolean | (Sólo modelos K-Means, Kohonen, TwoStep, SVM, KNN, Red bayesiana y Lista de decisiones.) Establece un límite de tiempo máximo para cualquier modelo. Por ejemplo, si un modelo determinado necesita un período de tiempo más largo del esperado para entrenarse debido a una interacción compleja, es probable que no quiera detener la ejecución de todo el modelado. |
model_build_time_limit |
entero | Tiempo empleado en la generación del modelo. |
enable_stop_after_time_limit |
Boolean | (Sólo modelos Red neuronal, K-Means, Kohonen, TwoStep, SVM, KNN, Red bayesiana y Árbol C&R) Detiene una ejecución después de un número de horas especificado. Se incluirán en el nugget de modelo todos los modelos generados hasta ese momento, pero no se producirán más modelos. |
stop_after_time_limit |
doble | Límite de tiempo (horas). |
stop_if_valid_model |
Boolean | Detiene una ejecución cuando un modelo pasa todos los criterios especificados bajo los valores de Descartar. |