Volver a la versión inglesa de la documentaciónpropiedades de twostepnode
propiedades de twostepnode
Última actualización: 07 oct 2024
El nodo Bietápico es un método de agrupación en clústeres de dos pasos. El primer paso es hacer una única pasada por los datos para comprimir los datos de entrada de la fila en un conjunto de subclústeres administrable. El segundo paso utiliza un método de agrupación en clústeres jerárquica para fundir progresivamente los subclústeres en clústeres cada vez más grandes. El bietápico tiene la ventaja de estimar automáticamente el número óptimo de clústeres para los datos de entrenamiento. Puede gestionar tipos de campos mixtos y grandes conjuntos de datos eficazmente.
Ejemplo
node = stream.create("twostep", "My node")
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["Age", "K", "Na", "BP"])
node.setPropertyValue("partition", "Test")
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "TwoStep_Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("exclude_outliers", True)
node.setPropertyValue("cluster_label", "String")
node.setPropertyValue("label_prefix", "TwoStep_")
node.setPropertyValue("cluster_num_auto", False)
node.setPropertyValue("max_num_clusters", 9)
node.setPropertyValue("min_num_clusters", 3)
node.setPropertyValue("num_clusters", 7)
Propiedades de twostepnode |
Valores | Descripción de la propiedad |
---|---|---|
inputs |
[field1 ... fieldN] | Los modelos bietápicos utilizan una lista de campos de entrada, pero no de campos objetivo. Los campos de ponderación y frecuencia no se reconocen. Consulte Propiedades comunes del nodo de modelado para obtener más información. |
standardize |
distintivo | |
exclude_outliers |
distintivo | |
percentage |
número | |
cluster_num_auto |
distintivo | |
min_num_clusters |
número | |
max_num_clusters |
número | |
num_clusters |
número | |
cluster_label |
String Number |
|
label_prefix |
serie | |
distance_measure |
Euclidean Loglikelihood |
|
clustering_criterion |
AIC BIC |