El nodo Agrupación en clústeres automática calcula y compara los modelos de agrupación en clústeres que identifican grupos de registros con características similares. El nodo funciona de la misma manera que otros nodos de modelado automático, lo que le permite experimentar con varias combinaciones de opciones en una única pasada de modelado. Los modelos se pueden comparar utilizando medidas básicas con las que se intenta filtrar y definir la utilidad de los modelos de clúster y proporcionar una medida según la importancia de campos concretos.
Los modelos de agrupación en clústeres se suelen identificar con grupos que se pueden utilizar como entradas en futuros análisis. Por ejemplo, es posible que desee dirigirse a grupos de clientes según sus características demográficas, como ingresos, o según los servicios que hayan contratado en el pasado. Puede hacerlo sin conocimientos previos sobre los grupos y sus características; es posible que no sepa en cuántos grupos buscar o las características que debe utilizar para definirlos. Los modelos de agrupación en clústeres se suelen definir como modelos de aprendizaje no supervisado, ya que no utilizan un campo de destino y no devuelven una predicción específica que se pueda evaluar como true o false. El valor de un modelo de agrupación en clústeres viene determinado por su capacidad de capturar agrupaciones interesantes en los datos y proporcionar descripciones útiles de dichas agrupaciones.
Requisitos. Uno o más campos que definen las características de interés. Los modelos de clúster no utilizan campos objetivo de la misma manera que otros modelos, porque no realizan predicciones específicas que se pueden evaluar como true o false. En su lugar, se utilizan para identificar grupos de casos que pueden estar relacionados. Por ejemplo, no puede utilizar un modelo de clúster para predecir si un cliente concreto abandonará o responderá a una oferta. Pero puede utilizar un modelo de clúster para asignar clientes a grupos en función de su tendencia a hacer determinadas cosas. Los campos de ponderación y frecuencia no se usan.
Campos de evaluación. Mientras no utilice un objetivo, puede especificar uno o más campos de evaluación que se utilizarán en la comparación de modelos. La utilidad de un modelo de clúster se puede evaluar lo bien (o mal) que los clústeres diferencian los campos.
Tipos de modelo soportados
Los tipos de modelo soportados incluyen Dos fases, K-Medias, Kohonen, SVM de una clase y K-Medias-AS.