Il nodo Cluster automatico stima e confronta i modelli di cluster che identificano gruppi di record con caratteristiche simili. Il nodo funziona in modo analogo ad altri nodi di modellazione automatici, consentendo di sperimentare più combinazioni di opzioni in un singolo passaggio di modellazione. I modelli si possono confrontare utilizzando misure di base con cui tentare di filtrare e classificare l'utilità dei modelli di cluster e fornire una misura in base all'importanza di determinati campi.
I modelli di cluster vengono spesso utilizzati per identificare gruppi che è possibile impiegare come input in analisi successive. Per esempio, si potrebbe desiderare di rivolgersi a gruppi di clienti in base a caratteristiche demografiche quali il reddito, o in base ai servizi acquistati in passato. Questo è possibile anche senza conoscere a priori i gruppi e le loro caratteristiche: è possibile che non si conosca il numero dei gruppi da cercare, o le caratteristiche da utilizzare nella loro definizione. I modelli di cluster vengono spesso definiti modelli di apprendimento non supervisionato, poiché non utilizzano un campo obiettivo e non restituiscono una previsione specifica che possa essere valutata come vera o falsa. Il valore di un modello di cluster è determinato dalla sua capacità di acquisire gruppi significativi all'interno dei dati e di fornire descrizioni utili di tali raggruppamenti.
Requisiti. Uno o più campi che definiscano caratteristiche interessanti. I modelli di cluster non utilizzano i campi obiettivo nello stesso modo degli altri modelli, perché non effettuano previsioni specifiche che è possibile valutare come vere o false. Essi sono invece utilizzati per identificare gruppi di casi che potrebbero essere correlati. Ad esempio, non è possibile utilizzare un modello di cluster per prevedere se un determinato cliente abbandonerà o risponderà a un'offerta. Con un modello di cluster si può tuttavia assegnare i clienti a dei gruppi in base alla loro tendenza a comportarsi in un modo o nell'altro. I campi peso e frequenza non sono utilizzati.
Campi di valutazione. Benché non vengano utilizzati obiettivi, è possibile specificare uno o più campi di valutazione da utilizzare nel confronto dei modelli. L'utilità di un modello di cluster si può valutare misurando la capacità dei cluster di operare una distinzione tra questi campi.
Tipi di modello supportati
I tipi di modelli supportati includono i modelli TwoStep, K-means, Kohonen, One-Class SVM e K-Means-AS.