Translation not up to date
Uzel K-Means poskytuje metodu klastrové analýzy. Lze jej použít k seskupení datové sady do různých skupin, když nevíte, co tyto skupiny jsou na začátku. Na rozdíl od většiny výukových metod v produktu SPSS Modelermodely K-Means nepoužívají cílové pole. Tento typ učení, bez cílového pole, se nazývá učení bez dozoru. Místo toho, aby se pokusili předpovědět výsledek, se K-Means snaží odhalit vzory v sadě vstupních polí. Záznamy jsou seskupeny tak, aby záznamy ve skupině nebo klastru měly tendenci být podobné sobě, ale záznamy v různých skupinách jsou nepodobné.
K-Means funguje tak, že definuje sadu spuštění center klastru odvozených z dat. Poté přiřadí každý záznam ke klastru, který je nejvíce podobný, na základě hodnot vstupního pole záznamu. Po přiřazení všech případů jsou centra klastru aktualizována tak, aby odrážela novou sadu záznamů přiřazených ke každému klastru. Záznamy se pak znovu kontrolují, zda mají být přeřazeny do jiného klastru, a proces přiřazení záznamů/procesu iterace klastru pokračuje, dokud není dosaženo maximálního počtu iterací, nebo změna mezi jednou iterací a dalším selháním, která překročí zadanou prahovou hodnotu.
Požadavky. Chcete-li vyškolit model K-Means, potřebujete jedno nebo více polí s rolí nastavenou na Input
. Pole s rolí nastavenou na Output
, Both
nebo None
se ignorují.
Silné stránky. Nemusíte mít data o členství ve skupině, abyste mohli sestavit model K-Means. Model K-Means je často nejrychlejší metodou klastrování pro velké datové sady.