Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12. 1. 2023
TwoStep Cluster je průzkumný nástroj, který je navržen tak, aby odhalil přírodní seskupení (nebo klastry) v rámci datové sady, která by jinak nebyla zřejmá. Algoritmus používaný touto procedurou má několik žádoucích funkcí, které jej odlišují od tradičních technik klastrování.
- Práce s kategoriálními a spojitými proměnnými. Předpokládá se, že proměnné jsou nezávislé, společné mnohonomické-normální rozdělení může být umístěn na kategoriální a spojité proměnné.
- Automatický výběr počtu klastrů. Porovnáváním hodnot kritéria modelového výběru mezi různými řešeními klastrů může procedura automaticky určovat optimální počet klastrů.
- Škálovatelnost. Při konstruování stromu funkce klastru (CF), který shrnuje záznamy, může algoritmus TwoStep analyzovat velké datové soubory.
Například maloobchodní a spotřební společnost běžně používají techniky klastrování na informace, které popisují jejich stravovací návyky, pohlaví, věk, úroveň příjmů a další atributy. Tyto společnosti přizpůsobují své strategie marketingu a vývoje produktů pro každou skupinu zákazníků za účelem zvýšení prodeje a budování loajality zákazníků.