Volver a la versión inglesa de la documentaciónpropiedades de kmeansasnode
propiedades de kmeansasnode
Última actualización: 10 sept 2024
k-medias es uno de los algoritmos de agrupación en clúster utilizado con más frecuencia. Agrupa en clúster puntos de datos en un número predefinido de clústeres. El nodo K-Means-AS en SPSS Modeler se implementa en Spark. Para obtener más información sobre los algoritmos k-means, consulte Clustering.1
Nota: El nodo K-Means-AS realiza la codificación one-hot automáticamente para variables categóricas.
Propiedades de kmeansasnode |
Valores | Descripción de la propiedad |
---|---|---|
roleUse |
serie | Especifique predefined para utilizar roles predefinidos o custom para utilizar asignaciones de campos personalizadas. El valor predeterminado es predefined . |
autoModel |
Boolean | Especifique true para utilizar el nombre predeterminado ($S-prediction ) para el nuevo campo de puntuación generado o false para utilizar un nombre personalizado. El valor predeterminado es true . |
features |
campo | Lista de los nombres de campo para la entrada cuando la propiedad roleUse se establece en custom . |
name |
serie | El nombre del nuevo campo de puntuación generado cuando la propiedad autoModel se establece en false . |
clustersNum |
entero | El número de clústeres para crear. El valor predeterminado es 5 . |
initMode |
serie | El algoritmo de inicialización. Los valores posibles son k-means|| o random . El valor predeterminado es k-means|| . |
initSteps |
entero | El número de pasos de inicialización cuando initMode se establece en k-means|| . El valor predeterminado es 2 . |
advancedSettings |
Boolean | Especifique true para que las cuatro propiedades siguientes estén disponibles. El valor predeterminado es false . |
maxIteration |
entero | Número máximo de iteraciones para la agrupación en clúster. El valor predeterminado es 20 . |
tolerance |
serie | La tolerancia para detener las iteraciones. Los valores posibles son 1.0E-1 , 1.0E-2 , ..., 1.0E-6 . El valor predeterminado es 1.0E-4 . |
setSeed |
Boolean | Especifique true para utilizar una semilla aleatoria personalizada. El valor predeterminado es false . |
randomSeed |
entero | La semilla aleatoria personalizada cuando la propiedad setSeed es true . |
displayGraph |
Boolean | Seleccione esta opción si desea que se incluya un gráfico en la salida. |
1 "Agrupación - API basada en RDD." Apache Spark. MLlib: Main Guide. Ago 2024.