Translation not up to date
Kohonenové sítě jsou typem neuronové sítě, která provádí klastrování, označovanou také jako knet nebo samoorganizovanou mapu. Tento typ sítě lze použít k seskupení datové sady do různých skupin, když nevíte, jaké skupiny jsou na začátku. Záznamy jsou seskupeny tak, aby záznamy v rámci skupiny nebo klastru měly tendenci být podobné sobě, a záznamy v různých skupinách jsou nepodobné.
Základní jednotky jsou neuronya jsou uspořádány do dvou vrstev: vstupní vrstvy a výstupní vrstvy (také nazývané výstupní mapa). Všechny vstupní neurony jsou připojeny ke všem výstupním neuronu a tato připojení mají silné stránkynebo váhy, které jsou k nim přidruženy. Během tréninku každá jednotka soutěží se všemi ostatními, aby "vyhrát" každý záznam.
Výstupní mapa je dvojrozměrná mřížka neuronů, bez spojení mezi jednotkami.
Vstupní data jsou předkládána vstupní vrstvě a hodnoty jsou šířeny do výstupní vrstvy. Výstupní neuron s největší odezvou se říká, že je vítěz a je odpověď na tento vstup.
Zpočátku jsou všechny váhy náhodné. Když jednotka získá záznam, její váhy (společně s těmi z jiných blízkých jednotek společně označenými jako okolí) jsou upraveny tak, aby lépe odpovídaly vzoru hodnot prediktoru pro tento záznam. Jsou zobrazeny všechny vstupní záznamy a váhy jsou odpovídajícím způsobem aktualizovány. Tento proces se opakuje mnohokrát, dokud se změny nestanou velmi malé. Jak probíhá školení, váhy v jednotkách mřížky jsou upraveny tak, aby tvořily dvojrozměrné "mapy" klastrů (tedy termín vlastní uspořádání mapy).
Když je síť plně vyškolena, záznamy, které jsou podobné, by měly být blízko sebe na výstupní mapě, zatímco záznamy, které jsou nesmírně odlišné budou daleko od sebe.
Na rozdíl od většiny výukových metod v produktu Watson Studio, sítě Kohonen nepoužívají cílové pole. Tento typ učení, bez cílového pole, se nazývá učení bez dozoru. Místo toho, abychom se pokusili předpovědět výsledek, snaží se sítě Kohonen odhalit vzorce v sadě vstupních polí. Obvykle bude mít Kohonen síť několik jednotek, které shrnují mnoho pozorování (silné jednotky) a několik jednotek, které ve skutečnosti neodpovídají žádnému z pozorování (slabé jednotky). Silné jednotky (a někdy i jiné jednotky přilehlé k nim v mřížce) představují pravděpodobná centra klastru.
Další využití sítí Kohonen se nachází ve snížení dimenze. Geografická charakteristika dvourozměrné mřížky poskytuje mapování z původních predikátů produktu k
na dvě odvozené funkce, které zachovávají vztahy podobnosti v původních predikátů. V některých případech vám to může poskytnout stejný typ výhody jako analýza faktoru nebo PCA.
Všimněte si, že metoda pro výpočet výchozí velikosti výstupní mřížky se liší od starších verzí produktu SPSS Modeler. Metoda obecně vytvoří menší výstupní vrstvy, které jsou rychlejší k vlaku a generalizovat lépe. Zjistíte-li, že máte špatné výsledky s výchozí velikostí, zkuste zvětšit velikost výstupní mřížky na kartě Odborník.
Požadavky. Chcete-li trénovat síť Kohonen, potřebujete jedno nebo více polí s rolí nastavenou na Input
. Pole s rolí nastavenou na Target
, Both
nebo None
se ignorují.
Silné stránky. Nemusíte mít data o členství ve skupině, abyste mohli sestavit síťový model Kohonen. Nepotřebujete znát ani počet skupin, které byste měli hledat. Kohoniové sítě začínají velkým počtem jednotek, a jako trénink postupuje, jednotky tíhnou k přírodním klastrům v datech. Můžete se podívat na počet pozorování zachycených každou jednotkou v modelu nugget k identifikaci silných jednotek, které vám mohou dát smysl pro vhodný počet klastrů.