propriétés hdbscannode
Dernière mise à jour : 12 févr. 2025
L'algorithme HDBSCAN (Hierarchical Density-Based Spatial Clustering)© utilise l'apprentissage non supervisé pour rechercher des clusters, ou des régions denses, d'un ensemble de données. Le noeud HDBSCAN dans SPSS Modeler expose les fonctions principales et les paramètres couramment utilisés de la bibliothèque HDBSCAN. Il est implémenté dans Python, et vous pouvez l'utiliser pour classer votre ensemble de données en groupes distincts lorsque vous ne savez pas quels étaient ces groupes au départ.
propriétés |
Type de données | Description de la propriété |
---|---|---|
custom_fields | Booléen | Cette option indique au noeud d'utiliser les informations du champ spécifiées ici, au lieu de celles fournies par un ou des noeuds Type en amont. Après avoir sélectionné cette option, spécifiez les zones suivantes, selon les besoins. |
|
Zone | Champs d'entrée pour le groupement. |
|
Booléen | Spécifiez ou pour activer ou désactiver l'optimisation HPO (Hyper-Parameter Optimization) basée sur Rbfopt, qui détecte automatiquement la combinaison optimale de paramètres afin que le modèle atteigne le taux d'erreur attendu ou inférieur sur les échantillons. La valeur par défaut est . |
|
Integer | Taille minimale des clusters. Spécifiez un entier. La valeur par défaut est . |
|
Integer | Nombre d'échantillons dans le voisinage pour qu'un point puisse être considéré comme un point central. Spécifiez un entier. Si la valeur est , est utilisé. La valeur par défaut est . |
|
chaîne | Indiquez l'algorithme à utiliser: , , , , ou . La valeur par défaut est . |
|
chaîne | Indiquez la mesure à utiliser lors du calcul de la distance entre les instances d'un tableau de fonctions: , , , , , , , , , ou . La valeur par défaut est . |
|
Booléen | Indiquez pour utiliser un libellé de cluster de chaînes, ou pour utiliser un libellé de cluster de nombres. La valeur par défaut est . |
|
chaîne | Si le paramètre est défini sur , indiquez une valeur pour le préfixe de libellé de chaîne. Le préfixe par défaut est . |
|
Booléen | Indiquez pour accepter une arborescence minimale approximative, ou si vous êtes prêt à sacrifier la vitesse pour l'exactitude. La valeur par défaut est . |
|
chaîne | Indiquez la méthode à utiliser pour la sélection des clusters à partir de l'arborescence condensée: ou . La valeur par défaut est (Excédent de l'algorithme de masse). |
|
Booléen | Indiquez si vous souhaitez autoriser les résultats de cluster unique. La valeur par défaut est . |
|
doublon | Indiquez à utiliser si vous utilisez pour la mesure. La valeur par défaut est . |
|
Integer | Si vous utilisez un algorithme d'arborescence d'espace ( ou ), indiquez le nombre de points dans un noeud terminal de l'arborescence. La valeur par défaut est . |
|
Booléen | Indiquez ou pour contrôler si le graphique d'index de validité est inclus dans la sortie du modèle. |
|
Booléen | Indiquez ou pour contrôler si le graphique de l'arborescence condensée est inclus dans la sortie du modèle. |
|
Booléen | Indiquez ou pour contrôler si l'arborescence de liens uniques est incluse dans la sortie du modèle. |
|
Booléen | Spécifiez ou pour contrôler si le graphique de l'arborescence d'espacement minimal est inclus dans la sortie du modèle. |
|
La rubrique a-t-elle été utile ?
0/1000