0 / 0
Go back to the English version of the documentation
Uzel klastru TwoStep
Last updated: 07. 7. 2023
Klastrový uzel TwoStep (SPSS Modeler)

Uzel klastru TwoStep poskytuje formulář klastrové analýzy. Lze jej použít k seskupení datové sady do různých skupin, když nevíte, co tyto skupiny jsou na začátku. Stejně jako u uzlů Kohonen a v uzlech K-Means TwoStep Modely klastrů nepoužívají cílové pole. Místo pokusů o předpověď výsledku se klastr TwoStep pokusí odhalit vzory v sadě vstupních polí. Záznamy jsou seskupeny tak, aby záznamy ve skupině nebo klastru měly tendenci být podobné sobě, ale záznamy v různých skupinách jsou nepodobné.

TwoStep Klastr je dvoustupňová metoda klastrování. První krok provede jednoduché předání prostřednictvím dat, během kterého komprimuje prvotní vstupní data do spravovatelné sady podklastrů. Druhý krok používá hierarchickou metodu klastrování k postupnému slučování podklastrů na větší a větší klastry, bez nutnosti dalšího průchodu dat. Hierarchické klastrování má tu výhodu, že nevyžaduje, aby byl počet klastrů vybrán před časem. Mnoho hierarchických metod klastrování začíná s jednotlivými záznamy jako počáteční klastry a slučuje je rekurzivně, aby vytvářely stále větší klastry. Ačkoli se takové přístupy často rozebírány s velkými objemy dat, TwoStep' je počáteční předlesknutí provádí hierarchické klastrování rychle i pro velké datové sady.

Poznámka: Výsledný model závisí do určité míry na pořadí dat odborné přípravy. Změna uspořádání dat a znovusestavení modelu může vést k jinému konečnému modelu klastru.

Požadavky. Chcete-li vycvičit model klastru TwoStep , potřebujete jedno nebo více polí s rolí nastaveným na Input. Pole s rolí nastavenou na Target, Bothnebo None se ignorují. Algoritmus klastru TwoStep neobsluhuje chybějící hodnoty. Záznamy s mezerami pro jakékoli vstupní pole budou při sestavení modelu ignorovány.

Silné stránky. TwoStep Klastr může pracovat se smíšenými typy polí a je schopen efektivně zpracovat velké datové sady. Má také schopnost testovat několik klastrovaných řešení a vybrat to nejlepší, takže nemusíte vědět, kolik klastrů požádat o hned na začátku. TwoStep Klastr může být nastaven tak, aby automaticky vyloučil outliers, nebo extrémně neobvyklé případy, které mohou kontaminovat vaše výsledky.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more