0 / 0
Go back to the English version of the documentation
węzeł Kohonena
Last updated: 12 sty 2023
Węzeł Kohonena (SPSS Modeler)

Sieć Kohonena to rodzaj sieci neuronowej, która przeprowadza grupowanie, znanej również jako sieć k lub mapa samoorganizująca. Sieć tego typu może być używana do grupowania zbioru danych w osobne grupy, jeśli nie wiadomo, czym są te grupy na początku. Rekordy są grupowane, tak aby rekordy należące do jednej grupy lub skupienia były do siebie podobne, a rekordy należące do różnych grup były do siebie niepodobne.

Podstawowymi jednostkami są neurony, które znajdują się na dwóch warstwach: na warstwie wejściowej i warstwie wyjściowej (zwanej również mapą wyników). Wszystkie neurony wejściowe są połączone ze wszystkimi neuronami wyjściowymi, a z połączeniami tymi powiązana jest siła lub waga. W czasie uczenia poszczególne jednostki konkurują z pozostałymi, aby „wygrać” dany rekord.

Mapa wynikowa jest dwuwymiarową siatką neuronów bez połączeń między jednostkami.

Dane wejściowe są przedstawiane na warstwie wejściowej, a wartości są umieszczane na warstwie wyjściowej. Neuron wyjściowy z najsilniejszą odpowiedzią jest zwycięzcą i stanowi odpowiedź dla zmiennej wejściowej.

Początkowo wszystkie wagi mają charakter losowy. Kiedy jednostka wygrywa rekord, jej wagi (wraz z wagami innych sąsiednich jednostek, zbiorczo zwanymi sąsiedztwem) zostają skorygowane, tak aby były lepiej dopasowane do wzorca wartości predykcyjnych dla danego rekordu. Wyświetlane są wszystkie rekordy wejściowe, a wagi zostają odpowiednio zaktualizowane. Ten proces jest wielokrotnie powtarzany, dopóki zmiany są niewielkie. W czasie uczenia wagi jednostek siatki są korygowane do momentu, aż utworzą dwuwymiarową „mapę” skupień (stąd termin mapa samoorganizująca).

Po pełnym przeszkoleniu sieci rekordy podobne do siebie powinny znajdować się blisko siebie na mapie wyników, podczas gdy rekordy bardzo różniące się powinny znajdować się daleko od siebie.

W przeciwieństwie do większości metod uczenia się w programie Watson Studio, sieci Kohonena nie korzystają z pola docelowego. Sposób uczenia bez zmiennej przewidywanej jest nazywany uczeniem nienadzorowanym. Zamiast prób przewidzenia danych wynikowych sieci Kohonena próbują ujawnić schematy w zestawie zmiennych wejściowych. Zwykle sieć Kohonena obejmuje kilka jednostek, które podsumowują wiele obserwacji (jednostek silnych), oraz kilka jednostek, które w rzeczywistości nie odpowiadają żadnym obserwacjom (słabe jednostki). Jednostki silne (i czasami inne jednostki sąsiadujące z nimi w siatce) reprezentują prawdopodobne centra skupień.

Inne zastosowanie sieci Kohonena polega na redukcji wymiarów. Charakterystyka przestrzenna sieci dwuwymiarowej zapewnia odwzorowanie predyktorów źródłowych k na dwa predyktory pochodne, które zachowują relacje podobieństwa do predyktorów źródłowych. W niektórych przypadkach takie działanie może przynieść korzyści takie same, jak analiza czynnikowa lub PCA.

Należy zauważyć, że metoda obliczania domyślnej wielkości siatki wyjściowej różni się od starszych wersji programu SPSS Modeler. Metoda ta generalnie wytwarza mniejsze warstwy wyjściowe, które szybciej będą trenować i generalizować lepiej. Jeśli okaże się, że rozmiar domyślny zapewnia słabe wyniki, należy podjąć próbę powiększenia rozmiaru siatki wynikowej na karcie Zaawansowane.

Wymagania. Aby potrenować sieć Kohonena, należy określić co najmniej jedno pole z rolą ustawioną na wartość Input. Pola z rolą ustawioną na Target, Bothlub None są ignorowane.

Mocne strony. W celu zbudowania modelu sieci Kohonena nie są wymagane dane przynależne do grupy. Nie jest wymagana nawet znajomość liczby poszukiwanych grup. Sieci Kohonena na początku zawierają duże liczby jednostek i w miarę postępu uczenia jednostki wykazują tendencję do tworzenia naturalnych skupień w danych. W celu zidentyfikowania jednostek silnych można przyjrzeć się liczbom obserwacji przechwyconych przez poszczególne jednostki w modelu użytkowym, co umożliwia przybliżone ustalenie właściwej liczby skupień.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more