Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
Uzel Auto Cluster odhaduje a porovnává modelové modely, které identifikují skupiny záznamů, které mají podobné charakteristiky. Uzel funguje stejným způsobem jako ostatní automatizované modelovací uzly, což vám umožňuje experimentovat s více kombinacemi voleb v rámci jednoho průchodu modelování. Modely lze porovnat s použitím základních ukazatelů, se kterými se můžete pokusit filtrovat a hodnotit užitečnost modelů klastru, a poskytnout ukazatel na základě důležitosti konkrétních polí.
Příklad
node = stream.create("autocluster", "My node")
node.setPropertyValue("ranking_measure", "Silhouette")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_silhouette_limit", True)
node.setPropertyValue("silhouette_limit", 5)
autoclusternode Vlastnosti |
Hodnoty | Popis vlastnosti |
---|---|---|
evaluation |
pole | Pozn.: Pouze uzel Automatický klastr. Identifikuje pole, pro které bude vypočítána hodnota důležitosti. Alternativně lze použít k identifikaci, jak dobře klastr rozlišuje hodnotu tohoto pole, a proto, jak dobře bude model předpovídat toto pole.
|
ranking_measure |
Silhouette Num_clusters Size_smallest_cluster Size_largest_cluster Smallest_to_largest Importance |
|
ranking_dataset |
Training Test |
|
summary_limit |
celočíselná hodnota | Počet modelů, které chcete vypsat v sestavě. Zadejte celé číslo mezi 1 a 100. |
enable_silhouette_limit |
příznak | |
silhouette_limit |
celočíselná hodnota | Celé číslo mezi 0 a 100. |
enable_number_less_limit |
příznak | |
number_less_limit |
Číslo | Reálné číslo mezi 0.0 a 1.0. |
enable_number_greater_limit |
příznak | |
number_greater_limit |
Číslo | Celé číslo je větší než 0. |
enable_smallest_cluster_limit |
příznak | |
smallest_cluster_units |
Percentage Counts |
|
smallest_cluster_limit_percentage |
Číslo | |
smallest_cluster_limit_count |
celočíselná hodnota | Celé číslo je větší než 0. |
enable_largest_cluster_limit |
příznak | |
largest_cluster_units |
Percentage Counts |
|
largest_cluster_limit_percentage |
Číslo | |
largest_cluster_limit_count |
celočíselná hodnota | |
enable_smallest_largest_limit |
příznak | |
smallest_largest_limit |
Číslo | |
enable_importance_limit |
příznak | |
importance_limit_condition |
Greater_than Less_than |
|
importance_limit_greater_than |
Číslo | Celé číslo mezi 0 a 100. |
importance_limit_less_than |
Číslo | Celé číslo mezi 0 a 100. |
<algorithm> |
příznak | Povoluje nebo zakazuje použití specifického algoritmu. |
<algorithm>.<property> |
řetězec | Nastaví hodnotu vlastnosti pro specifický algoritmus. Další informace viz Nastavení vlastností algoritmu . |
number_of_models |
celočíselná hodnota | |
enable_model_build_time_limit |
typ boolean | (K-Means, Kohonen, TwoStep, SVM, KNN, Bayes Net and Decision List models only.) Nastavuje maximální časový limit pro každý model. Pokud například určitý model vyžaduje neočekávaně dlouhou dobu trénovat kvůli určité složité interakci, pravděpodobně ji nechcete, aby se udržoval v celém běhu modelování. |
model_build_time_limit |
celočíselná hodnota | Čas vynaložený na sestavení modelu. |
enable_stop_after_time_limit |
typ boolean | (Neuronové sítě, K-Means, Kohonen, TwoStep, SVM, KNN, Bayes Net a modely C & R Tree).) Zastaví běh po uvedeném počtu hodin. Všechny modely generované do tohoto místa budou zahrnuty do modelu nugget, ale žádné další modely budou vyráběny. |
stop_after_time_limit |
dvojitý | Časový limit spuštění (hodiny). |
stop_if_valid_model |
typ boolean | Zastaví běh, když model projde všechna kritéria uvedená pod nastavením vyřazení. |