La agrupación en clúster espacial basada en la densidad jerárquica (HDBSCAN)© utiliza el aprendizaje no supervisado para buscar clústeres, o regiones densas, de un conjunto de datos.
El nodo HDBSCAN en watsonx.ai expone las características principales y los parámetros utilizados habitualmente de la biblioteca HDBSCAN. El nodo se implementa en Python, y puede utilizarlo para agrupar en clúster el conjunto de datos en grupos distintos cuando no sabe que grupos son al principio. A diferencia de la mayoría de los métodos de aprendizaje en watsonx.ai, los modelos HDBSCAN no utilizan un campo objetivo. Este tipo de aprendizaje, sin campo objetivo, se denomina aprendizaje no supervisado. En lugar de intentar predecir un resultado, HDBSCAN intenta revelar los patrones en el conjunto de campos de entrada. Los registros se agrupan de manera que los de un mismo grupo o clúster tiendan a ser similares entre ellos, y que los de otros grupos sean distintos. El algoritmo HDBSCAN ve los clústeres como áreas de alta densidad separadas por áreas de baja densidad. Debido a esta vista bastante genérica, los clústeres encontrados por HDBSCAN puede tener cualquier forma, en contraposición a lo que sucede con k-medias, que dan por supuesto que los clústeres tienen una forma convexa. También se marcan puntos de valor atípico que residen solos en regiones de baja densidad. HDBSCAN también admite la puntuación de nuevas muestras.1
Para utilizar el nodo HDBSCAN, debe configurar un nodo Tipo en sentido ascendente. El nodo HDBSCAN leerá valores de entrada del nodo Tipo (o de los Tipos de un nodo de importación en sentido ascendente).
Para obtener más información sobre los algoritmos de agrupación en clúster HDBSCAN, consulte la documentación de HDBSCAN. 1
1 "Guía del usuario / Guía de aprendizaje." La biblioteca de agrupación en clúster hdbscan. Web. © 2016, Leland McInnes, John Healy, Steve Astels.