Retourner à la version anglaise de la documentationpropriétés de kmeansasnode
propriétés de kmeansasnode
Dernière mise à jour : 10 sept. 2024
K moyenne est l'un des algorithmes de cluster les plus couramment utilisés. Il regroupe des points de données au sein d'un certain nombre de clusters prédéfinis. Le noeud K-Moyennes-AS dans SPSS Modeler est implémenté dans Spark. Pour plus d'informations sur les algorithmes k-means, voir Clustering.1
Note: Le nœud K-Means-AS effectue automatiquement un encodage à un coup pour les variables catégorielles.
Propriétés kmeansasnode |
Valeurs | Description de la propriété |
---|---|---|
roleUse |
chaîne | Spécifiez predefined pour utiliser des rôles prédéfinis, ou custom pour utiliser des affectations de champs personnalisés. La valeur par défaut est predefined . |
autoModel |
Booléen | Spécifiez true pour utiliser le nom par défaut ($S-prediction ) pour le nouveau champ d'évaluation généré, ou false pour utiliser un nom personnalisé. La valeur par défaut est true . |
features |
Zone | Liste des noms de champ de saisie lorsque la propriété roleUse est définie sur custom . |
name |
chaîne | Nom du nouveau champ d'évaluation généré lorsque la propriété autoModel est définie sur false . |
clustersNum |
Integer | Nombre de clusters à créer. La valeur par défaut est 5 . |
initMode |
chaîne | Algorithme d'initialisation. Les valeurs possibles sont k-means|| ou random . La valeur par défaut est k-means|| . |
initSteps |
Integer | Nombre d'étapes d'initialisation lorsque initMode est défini sur k-means|| . La valeur par défaut est 2 . |
advancedSettings |
Booléen | Spécifiez true pour que les quatre propriétés suivantes soient disponibles. La valeur par défaut est false . |
maxIteration |
Integer | Nombre maximal d'itérations pour le groupement. La valeur par défaut est 20 . |
tolerance |
chaîne | Tolérance d'arrêt des itérations. Les paramètres possibles sont 1.0E-1 , 1.0E-2 , ..., 1.0E-6 . La valeur par défaut est 1.0E-4 . |
setSeed |
Booléen | Indiquez true pour utiliser une valeur aléatoire de départ personnalisée. La valeur par défaut est false . |
randomSeed |
Integer | Valeur de départ aléatoire personnalisée lorsque la propriété setSeed est true . |
displayGraph |
Booléen | Sélectionnez cette option si vous voulez qu'un graphique soit inclus dans la sortie. |
1 "Clustering - RDD-based API." Apache Spark. MLlib: Main Guide. Août 2024.