Retourner à la version anglaise de la documentationpropriétés de twostepnode
propriétés de twostepnode
Dernière mise à jour : 04 oct. 2024
Le noeud TwoStep utilise une méthode de classification non supervisée en deux étapes. La première étape consiste en une exploration des données visant à compresser les données d'entrée brutes en sous-clusters plus faciles à manipuler. Au cours de la seconde étape, l'utilisation d'une méthode de classification hiérarchique permet de fusionner progressivement les sous-clusters en clusters de plus en plus importants. La technique TwoStep a l'avantage d'évaluer automatiquement le nombre de clusters optimal pour les données d'apprentissage. Il peut prendre en charge de manière efficace des types de champ mixtes et des jeux de données volumineux.
Exemple
node = stream.create("twostep", "My node")
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["Age", "K", "Na", "BP"])
node.setPropertyValue("partition", "Test")
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "TwoStep_Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("exclude_outliers", True)
node.setPropertyValue("cluster_label", "String")
node.setPropertyValue("label_prefix", "TwoStep_")
node.setPropertyValue("cluster_num_auto", False)
node.setPropertyValue("max_num_clusters", 9)
node.setPropertyValue("min_num_clusters", 3)
node.setPropertyValue("num_clusters", 7)
Propriétés twostepnode |
Valeurs | Description de la propriété |
---|---|---|
inputs |
[field1 ... fieldN] | Les modèles TwoStep utilisent une liste de champs d'entrée, mais pas de cible. Les champs de pondération et de fréquence ne sont pas reconnus. Pour plus d'informations, voir Propriétés communes des noeuds de modélisation . |
standardize |
option | |
exclude_outliers |
option | |
percentage |
number | |
cluster_num_auto |
option | |
min_num_clusters |
number | |
max_num_clusters |
number | |
num_clusters |
number | |
cluster_label |
String Number |
|
label_prefix |
chaîne | |
distance_measure |
Euclidean Loglikelihood |
|
clustering_criterion |
AIC BIC |