propriétés de kmeansasnode
Dernière mise à jour : 12 févr. 2025
K moyenne est l'un des algorithmes de cluster les plus couramment utilisés. Il regroupe des points de données au sein d'un certain nombre de clusters prédéfinis. Le noeud K-Moyennes-AS dans SPSS Modeler est implémenté dans Spark. Pour plus d'informations sur les algorithmes k-means, voir Clustering.1
Note: Le nœud K-Means-AS effectue automatiquement un encodage à un coup pour les variables catégorielles.
Propriétés
|
Valeurs | Description de la propriété |
---|---|---|
|
chaîne | Spécifiez pour utiliser des rôles prédéfinis, ou pour utiliser des affectations de champs personnalisés. La valeur par défaut est . |
|
Booléen | Spécifiez pour utiliser le nom par défaut ( ) pour le nouveau champ d'évaluation généré, ou pour utiliser un nom personnalisé. La valeur par défaut est . |
|
Zone | Liste des noms de champ de saisie lorsque la propriété est définie sur . |
|
chaîne | Nom du nouveau champ d'évaluation généré lorsque la propriété est définie sur . |
|
Integer | Nombre de clusters à créer. La valeur par défaut est . |
|
chaîne | Algorithme d'initialisation. Les valeurs possibles sont ou . La valeur par défaut est . |
|
Integer | Nombre d'étapes d'initialisation lorsque est défini sur . La valeur par défaut est . |
|
Booléen | Spécifiez pour que les quatre propriétés suivantes soient disponibles. La valeur par défaut est . |
|
Integer | Nombre maximal d'itérations pour le groupement. La valeur par défaut est . |
|
chaîne | Tolérance d'arrêt des itérations. Les paramètres possibles sont , , ..., . La valeur par défaut est . |
|
Booléen | Indiquez pour utiliser une valeur aléatoire de départ personnalisée. La valeur par défaut est . |
|
Integer | Valeur de départ aléatoire personnalisée lorsque la propriété est . |
|
Booléen | Sélectionnez cette option si vous voulez qu'un graphique soit inclus dans la sortie. |
1 "Clustering - RDD-based API." Apache Spark. MLlib: Main Guide. Août 2024.
La rubrique a-t-elle été utile ?
0/1000