Retourner à la version anglaise de la documentationpropriétés de autoclusternode
propriétés de autoclusternode
Dernière mise à jour : 07 oct. 2024
Le noeud Cluster automatique évalue et compare les modèles de classification identifiant des groupes d'enregistrements ayant des caractéristiques similaires. Le noeud fonctionne de la même manière que les autres noeuds modélisation automatiques, vous permettant de tester plusieurs combinaisons d'options en une seule modélisation. Les modèles peuvent être comparés à l'aide de mesures de bases permettant d'essayer de filtrer et de classer l'utilité des modèles de classification et de fournir une mesure en fonction de l'importance de champs particuliers.
Exemple
node = stream.create("autocluster", "My node")
node.setPropertyValue("ranking_measure", "Silhouette")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_silhouette_limit", True)
node.setPropertyValue("silhouette_limit", 5)
Propriétés autoclusternode |
Valeurs | Description de la propriété |
---|---|---|
evaluation |
Zone | Remarque: noeud Cluster automatique uniquement. Identifie le champ pour lequel une valeur d'importance sera calculée. On peut aussi l'utiliser pour déterminer dans quelle mesure le cluster différencie la valeur de ce champ et, par conséquent, dans quelle mesure le modèle prédira ce champ.
|
ranking_measure |
Silhouette Num_clusters Size_smallest_cluster Size_largest_cluster Smallest_to_largest Importance |
|
ranking_dataset |
Training Test |
|
summary_limit |
Integer | Nombre de modèles devant figurer dans le rapport. Indiquez un entier compris entre 1 et 100. |
enable_silhouette_limit |
option | |
silhouette_limit |
Integer | Entier compris entre 0 et 100. |
enable_number_less_limit |
option | |
number_less_limit |
number | Nombre réel compris entre 0,0 et 1,0. |
enable_number_greater_limit |
option | |
number_greater_limit |
number | Entier supérieur à 0. |
enable_smallest_cluster_limit |
option | |
smallest_cluster_units |
Percentage Counts |
|
smallest_cluster_limit_percentage |
number | |
smallest_cluster_limit_count |
Integer | Entier supérieur à 0. |
enable_largest_cluster_limit |
option | |
largest_cluster_units |
Percentage Counts |
|
largest_cluster_limit_percentage |
number | |
largest_cluster_limit_count |
Integer | |
enable_smallest_largest_limit |
option | |
smallest_largest_limit |
number | |
enable_importance_limit |
option | |
importance_limit_condition |
Greater_than Less_than |
|
importance_limit_greater_than |
number | Entier compris entre 0 et 100. |
importance_limit_less_than |
number | Entier compris entre 0 et 100. |
<algorithm> |
option | Active ou désactive l'utilisation d'un algorithme particulier. |
<algorithm>.<property> |
chaîne | Définit une valeur de propriété pour un algorithme spécifique. Pour plus d'informations, voir Définition des propriétés d'algorithme . |
number_of_models |
Integer | |
enable_model_build_time_limit |
Booléen | (K-Means, Kohonen, TwoStep, SVM, KNN, Bayes Net et les modèles de liste de décision uniquement.) Définit une limite de temps maximale pour un modèle donné. Par exemple, si l'apprentissage d'un modèle donné prenait un temps particulièrement long du fait d'une interaction complexe, vous ne voudriez pas qu'il ralentisse l'exécution de la modélisation complète. |
model_build_time_limit |
Integer | Temps passé sur la génération du modèle. |
enable_stop_after_time_limit |
Booléen | (Modèles de réseau de neurones, K-Means, Kohonen, TwoStep, SVM, KNN, Bayes Net et C&R Tree uniquement.) Arrête une exécution après un nombre d'heures spécifié. Tous les modèles générés jusqu'à ce moment-là sont inclus dans le nugget de modèle, mais aucun autre modèle n'est ensuite généré. |
stop_after_time_limit |
doublon | Délai d'exécution (heures). |
stop_if_valid_model |
Booléen | Arrête une exécution lorsqu'un modèle transmet tous les critères spécifiés sous les paramètres de suppression. |