Les réseaux Kohonen représentent un type de réseau de neurones effectuant des opérations de classification non supervisée. Ils sont également appelés knet ou cartes auto-organisatrices. Ce type de réseau permet de classer l'ensemble de données en groupes distincts lorsque vous ne savez pas quels étaient ces groupe au départ. Les enregistrements similaires sont rassemblés dans le même groupe ou le même cluster.
Les unités de base sont les neurones. Ils sont organisés en deux couches : la couche d'entrée et la couche de sortie (également appelée connexion de sortie). Tous les neurones d'entrée sont connectés à tous les neurones de sortie. Ces connexions ont une puissance ou une pondération associée. Au cours de l'apprentissage, chaque unité entre en compétition avec les autres pour "gagner" des enregistrements.
La connexion de sortie est une grille de neurones à deux dimensions, sans connexion entre les unités.
Les données d'entrée sont présentées à la couche d'entrée et les valeurs sont diffusées vers la couche de sortie. Le neurone de sortie avec la réponse la plus forte l'emporte et celle-ci est adoptée comme réponse pour cette entrée.
Au départ, tous les coefficients de pondération sont aléatoires. Lorsqu'une unité gagne un enregistrement, ses poids (ainsi que ceux des unités proches, regroupées sous le terme de voisinage) sont ajustés de façon à mieux correspondre au modèle des prédicteurs de cet enregistrement. Tous les enregistrements d'entrée sont affichés et les coefficients de pondération sont mis à jour en conséquence. Ce processus est répété autant de fois que nécessaire jusqu'à ce que les changements soient minimes. Au fil de l'apprentissage, les poids sur les unités de la grille sont ajustés de façon à former une "carte" bidimensionnelle des clusters (d'où le terme carte auto-organisatrice).
Lorsque l'apprentissage du réseau est terminé, les enregistrements similaires doivent être regroupés dans la connexion de sortie, tandis que les enregistrements différents sont à l'opposé.
Contrairement à la plupart des méthodes d'apprentissage dans watsonx.ai, les réseaux Kohonen n'utilisent pas de champ cible. Ce type d'apprentissage qui n'utilise aucun champ cible est appelé apprentissage non supervisé. Au lieu de tenter de prédire un résultat, les réseaux Kohonen tentent de découvrir des tendances dans l'ensemble de champs d'entrée. En général, à la fin de l'apprentissage, un réseau Kohonen comporte un petit nombre d'unités qui résument un grand nombre d'observations (les unités fortes), et plusieurs autres unités qui ne correspondent à aucune observation particulière (les unités faibles). Les unités fortes (et parfois les unités adjacentes dans la grille) représentent des centres de cluster probables.
Vous pouvez également utiliser les réseaux Kohonen via la réduction dimensionnelle. La caractéristique spatiale de la grille bidimensionnelle fournit un mappage entre les k
prédicteurs d'origine et deux fonctions dérivées qui préservent les relations de similarité des prédicteurs. Dans certains cas, cela se révèle aussi avantageux qu'une analyse factorielle ou une ACP.
Notez que la méthode de calcul de la taille par défaut de la grille de sortie est différente des anciennes versions de SPSS Modeler. La méthode produira généralement des couches de sortie plus petites, dont l'apprentissage est plus rapide et qui produisent une meilleure généralisation. Si vous estimez que les résultats obtenus avec la taille par défaut ne sont pas satisfaisants, essayez d'augmenter la taille de la grille de sortie dans l'onglet Expert.
Conditions requises. Pour entraîner un réseau Kohonen, vous avez besoin d'un ou de plusieurs champs dont le rôle est défini sur Input
. Les champs dont le rôle est défini sur Target
, Both
ou None
sont ignorés.
Force. Il n'est pas nécessaire de disposer de données sur l'affectation des groupes pour générer un modèle de réseau Kohonen. Vous n'avez même pas besoin de connaître le nombre de groupes à rechercher. Les réseaux Kohonen comportent au départ un grand nombre d'unités qui, au fil de l'apprentissage, sont attirées par les clusters naturels des données. Vous pouvez étudier le nombre d'observations capturées par chaque unité du nugget de modèle afin d'identifier les unités fortes, ce qui vous donnera une idée du nombre de clusters approprié.