La rete Kohonen è un tipo di rete neurale che esegue il raggruppamento tramite cluster, conosciuta anche come knet o mappa auto-organizzante. Questo tipo di rete può essere utilizzato per raggruppare l'insieme di dati in gruppi distinti quando non si è in grado di definire immediatamente le caratteristiche di tali gruppi. I record vengono raggruppati in modo che quelli simili si trovino nello stesso gruppo o cluster e quelli dissimili in gruppi diversi.
Le unità di base sono i neuroni, organizzati in due livelli: livello di input e livello di output (detto anche mappa di output). Tutti i neuroni di input vengono connessi a tutti i neuroni di output e a queste connessioni vengono associati pesi o intensità. Durante l'addestramento, le unità competono tra di loro per "aggiudicarsi" ciascun record.
La mappa di output è costituita da una griglia bidimensionale di neuroni, senza connessioni tra le unità.
I dati di input vengono presentati nel livello iniziale e i valori vengono propagati nel livello di output. Il neurone di output che fornisce la risposta di maggiore intensità viene definito vincitore e rappresenta la risposta per l'input.
Inizialmente tutti i pesi sono casuali. Quando un'unità si aggiudica un record, i suoi pesi (e quelli di altre unità vicine, chiamate collettivamente vicinanza) vengono adeguati per meglio corrispondere allo schema dei valori predittori per quel record. Vengono visualizzati tutti i record di input e i pesi vengono aggiornati di conseguenza. Questo processo viene ripetuto numerose volte fino a ottenere variazioni estremamente ridotte. Man mano che l'addestramento procede, i pesi sulle unità della griglia vengono adeguati in modo da formare una "mappa" bidimensionale dei cluster, da qui il termine mappa auto-organizzante.
Al termine dell'apprendimento della rete, i record analoghi dovranno essere vicini nella mappa di output, mentre i record molto diversi saranno a notevole distanza.
A differenza della maggior parte dei metodi di apprendimento in watsonx.ai, le reti Kohonen non utilizzano un campo obiettivo. Questo tipo di apprendimento, privo di campi obiettivo, viene chiamato apprendimento non supervisionato. Invece di tentare di prevedere un risultato, le reti Kohonen cercano di scoprire gli schemi presenti nell'insieme di campi di input. In genere, una rete Kohonen finisce per avere poche unità che riassumono molte osservazioni (unità forti) e molte unità che non corrispondono a nessuna delle osservazioni (unità deboli). Le unità forti (e a volte altre unità adiacenti ad esse nella griglia) rappresentano i centri di cluster probabili.
Le reti Kohonen sono utilizzate anche per eseguire una riduzione della dimensione. La caratteristica spaziale della griglia bidimensionale fornisce una mappatura dai predittori k
originali a due funzioni derivate che preservano le relazioni di similarità nei predittori originali. In alcuni casi, questa funzione offre lo stesso vantaggio dell'analisi fattoriale o PCA.
Notare che il metodo per calcolare la dimensione predefinita della griglia di output è diverso dalle precedenti versioni di SPSS Modeler. Il metodo generalmente produrrà livelli di output più piccoli che sono più rapidi da addestrare e meglio generalizzabili. Se la dimensione predefinita dà scarsi risultati, provare ad aumentare la dimensione della griglia di output nella scheda Livello avanzato.
Requisiti. Per addestrare una rete Kohonen, è necessario avere uno o più campi con il ruolo impostato su Input
. I campi con il ruolo impostato su Target
, Both
o None
vengono ignorati.
Efficacia. Per generare un modello di rete Kohonen non è necessario che vi siano dati sull'appartenenza ai gruppi. Non occorre nemmeno sapere il numero di gruppi da cercare. Le reti Kohonen partono con un grande numero di unità che, nel corso dell'addestramento, gravitano verso i cluster naturali nei dati. Per identificare le unità forti e avere così un'idea del numero appropriato di cluster, controllare il numero di osservazioni catturate da ciascuna unità nel nugget del modello.