Le noeud Cluster automatique évalue et compare les modèles de classification identifiant des groupes d'enregistrement ayant des caractéristiques similaires. Le noeud fonctionne de la même manière que les autres noeuds modélisation automatiques, vous permettant de tester plusieurs combinaisons d'options en une seule passe de modélisation. Les modèles peuvent être comparés à l'aide de mesures de bases permettant d'essayer de filtrer et de classer l'utilité des modèles de classification et de fournir une mesure en fonction de l'importance de champs particuliers.
Les modèles de classification sont souvent utilisés pour identifier les groupes pouvant être utilisés comme entrées dans des analyses ultérieures. Par exemple, vous voulez peut-être cibler des groupes de clients en fonction de caractéristiques démographiques telles que le revenu, ou des services qu'ils ont acheté dans le passé. Ceci peut être effectué sans connaître auparavant les groupes et leurs caractéristiques -- vous ne savez peut-être pas combien de groupes rechercher ou quelles fonctions utiliser dans leur définition. Les modèles de classification sont souvent appelés modèles d'apprentissage non supervisé car ils n'utilisent pas de champ cible et ne renvoient pas de prédiction spécifique pouvant être évaluée comme vraie ou fausse. La valeur d'un modèle de classification est déterminée par sa capacité à capturer des groupements intéressants dans les données et à fournir des descriptions utiles de ces mêmes groupements.
Conditions requises. Un ou plusieurs champs définissant des caractéristiques intéressantes. Les modèles de classification n'utilisent pas de champs cibles de la même manière que d'autres modèles car ils ne font pas de prédictions spécifiques pouvant être évaluées comme vraies ou fausses. Ils sont plutôt utilisés pour identifier des groupes d'observations pouvant être liés. Par exemple, vous ne pouvez pas utiliser un modèle de classification pour prédire si un client donné refusera ou répondra à une offre. Mais vous pouvez utiliser un modèle de classification pour attribuer des clients à des groupes en fonction de leur tendance à faire cela. Les champs de pondération et de fréquence ne sont pas utilisés.
Champs d'évaluation. Quand aucune cible n'est utilisée, vous pouvez facultativement spécifier un ou plusieurs champs d'évaluation à utiliser pour comparer les modèles. L'utilité d'un modèle de classification peut être évaluée en mesurant la qualité (ou la mauvaise qualité) avec laquelle les clusters différencient ces champs.
Types de modèle pris en charge
Les types de modèle pris en charge comprennent TwoStep, k moyenne, Kohonen, SVM à classe unique et K moyenne AS.