propiedades de hdbscannode
Última actualización: 11 feb 2025
La agrupación en clúster espacial basada en la densidad jerárquica (HDBSCAN)© utiliza el aprendizaje no supervisado para buscar clústeres, o regiones densas, de un conjunto de datos. El nodo HDBSCAN en SPSS Modeler expone las características principales y los parámetros utilizados habitualmente de la biblioteca HDBSCAN. El nodo se implementa en Python, y puede utilizarlo para agrupar en clúster el conjunto de datos en grupos distintos cuando no sabe que grupos son al principio.
Propiedades de
|
Tipo de datos | Descripción de la propiedad |
---|---|---|
campos_cliente | Boolean | Esta opción permite indicar al nodo que use la información de campo especificada aquí en lugar de la proporcionada en nodos Tipo situados en cualquier punto anterior de la ruta. Después de seleccionar esta opción, especifique los campos siguientes según sea necesario. |
|
campo | Campos de entrada para la agrupación en clúster. |
|
Boolean | Especifique o para habilitar o inhabilitar HPO (Hyper-Parameter Optimization) basándose en Rbfopt, que descubre automáticamente la combinación óptima de parámetros para que el modelo alcance la tasa de error esperada o menor en las muestras. El valor predeterminado es . |
|
entero | El tamaño mínimo de clústeres. Especifique un entero. El valor predeterminado es . |
|
entero | El número de muestras en un vecindario para un punto que se va a considerar un punto central. Especifique un entero. Si se establece en , se utiliza . El valor predeterminado es . |
|
serie | Especifique qué algoritmo utilizar: , , , , o . El valor predeterminado es . |
|
serie | Especifique qué métrica se debe utilizar al calcular la distancia entre instancias de una matriz de características: , , , , , , , , , o . El valor predeterminado es . |
|
Boolean | Especifique para utilizar una etiqueta de clúster de serie o para utilizar una etiqueta de clúster de números. El valor predeterminado es . |
|
serie | Si el parámetro se establece en , especifique un valor para el prefijo de etiqueta de serie. El prefijo predeterminado es . |
|
Boolean | Especifique para aceptar un árbol de expansión mínimo aproximado, o si está dispuesto a sacrificar la velocidad por la corrección. El valor predeterminado es . |
|
serie | Especifique el método que se utilizará para seleccionar clústeres del árbol condensado: o . El valor predeterminado es (Exceso de algoritmo de masa). |
|
Boolean | Especifique si desea permitir los resultados de un único clúster. El valor predeterminado es . |
|
double | Especifique el que se utilizará si utiliza para la métrica. El valor predeterminado es . |
|
entero | Si utiliza un algoritmo de árbol de espacio ( o ), especifique el número de puntos en un nodo de hoja del árbol. El valor predeterminado es . |
|
Boolean | Especifique o para controlar si el gráfico Índice de validez se incluye en la salida del modelo. |
|
Boolean | Especifique o para controlar si el gráfico Árbol condensado se incluye en la salida del modelo. |
|
Boolean | Especifique o para controlar si el diagrama Árbol de enlace único se incluye en la salida del modelo. |
|
Boolean | Especifique o para controlar si el gráfico Árbol mín de expansión se incluye en la salida del modelo. |
|
¿Fue útil el tema?
0/1000