0 / 0
Retourner à la version anglaise de la documentation
Noeud Classification TwoStep
Dernière mise à jour : 04 oct. 2024
Nœud classification TwoStep (SPSS Modeler)

Le noeud Classification TwoStep permet une sorte d'analyse de clusters. Ce type de noeud permet de classer les données en groupes distincts lorsqu'aucun groupe n'est défini au départ. Comme pour les noeuds Kohonen et k moyenne, les modèles de classification TwoStep n'utilisent aucun champ cible. Le noeud Classification TwoStep n'essaie pas de générer des prévisions, mais tente de découvrir des tendances au sein des champs d'entrée. Les enregistrements sont rassemblés dans le même groupe ou le même cluster.

La méthode Classification TwoStep se déroule en deux étapes. La première étape consiste en une exploration des données au cours de laquelle les données d'entrée brutes sont compressées en sous-clusters plus faciles à manipuler. Au cours de la seconde étape, l'utilisation d'une méthode de classification hiérarchique permet de fusionner progressivement les sous-clusters en clusters de plus en plus importants, sans qu'un nouvel examen des données soit nécessaire. Avec la classification hiérarchique, il n'est pas nécessaire de sélectionner à l'avance le nombre de clusters. De nombreuses méthodes de classification non supervisée hiérarchique prennent comme clusters de départ des enregistrements individuels qu'elles fusionnent ensuite pour générer des clusters de plus en plus importants. Même si de telles méthodes se révèlent souvent inefficaces face à de grands volumes de données, l'étape de pré-classification de la méthode TwoStep permet d'accélérer le processus de classification.

Remarque: le modèle résultant dépend dans une certaine mesure de l'ordre des données d'apprentissage. Si vous réorganisez vos données et recréez le modèle, le modèle final risque d'être différent.

Conditions requises. Pour entraîner un modèle de cluster TwoStep , vous avez besoin d'un ou de plusieurs champs dont le rôle est défini sur Input. Les champs dont le rôle est défini sur Target, Bothou None sont ignorés. L'algorithme de classification TwoStep ne traite pas les valeurs manquantes. Les enregistrements dont les champs d'entrée ne contiennent pas de valeur sont ignorés lors de la création du modèle.

Force. Le noeud de classification TwoStep peut prendre en charge de manière efficace des types de champ mixte et des volumes importants de données. Il est également capable de tester plusieurs solutions de classification pour choisir la plus performante, de sorte que vous n'avez plus besoin de spécifier au départ le nombre de clusters. Le noeud Classification TwoStep peut également être configuré de façon à exclure automatiquement les valeurs extrêmes ou extrêmement rares qui peuvent contaminer les résultats.

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus