0 / 0
Volver a la versión inglesa de la documentación
Nodo Kohonen
Última actualización: 22 nov 2024
Nodo Kohonen (SPSS Modeler)

Las redes de Kohonen son un tipo de red neuronal que realiza agrupación en clústeres, también conocidas como knet o como un mapa autoorganizativo. Este tipo de redes se puede utilizar para agrupar el conjunto de datos en grupos distintos cuando no se sabe lo que son al principio. Los registros se agrupan de manera que los de un mismo grupo o clúster tiendan a ser similares entre ellos y que los de otros grupos sean distintos.

Las unidades básicas son neuronas y se organizan en dos capas: la capa de entrada y la capa de salida (también denominada mapa de resultados). Todas las neuronas de entrada están conectadas a todas las neuronas de salida, y estas conexiones tienen fuerzas o ponderaciones asociadas a ellas. Durante el entrenamiento, cada unidad compite con las demás para "ganar" cada registro.

El mapa de resultados es una red de neuronas bidimensional sin conexiones entre las unidades.

Los datos de entrada se presentan en la capa de entrada y los valores se propagan a la capa de salida. La neurona de salida con la respuesta más fuerte se considera la ganadora y constituye la respuesta para dicha entrada.

Al comienzo, todas las ponderaciones son aleatorias. Cuando una unidad gana un registro, sus fuerzas (junto con las de las unidades más próximas, colectivamente conocidas como vecindad) se ajustan para coincidir mejor con el patrón de los valores predictores de dicho registro. Se presentan todos los registros de entrada y se actualizan todas las ponderaciones consecuentemente. Este proceso se repite varias veces hasta que las modificaciones sean muy pequeñas. A medida que avanza el entrenamiento, las ponderaciones en las unidades de la tabla se ajustan para formar un "mapa" bidimensional de los clústeres (de ahí el término mapa autoorganizativo).

Cuando la red se termina de entrenar, los registros que son similares se deberían cerrar juntos en el mapa de resultados, mientras que los registros que son muy diferentes aparecerían aparte.

A diferencia de la mayoría de los métodos de aprendizaje en ' watsonx.ai Studio, las redes de Kohonen no utilizan un campo objetivo. Este tipo de aprendizaje, sin campo objetivo, se denomina aprendizaje no supervisado. En lugar de intentar predecir un resultado, las redes de Kohonen intentan revelar los patrones en el conjunto de campos de entrada. Por lo general, una red de Kohonen termina con unas pocas unidades que resumen muchas observaciones (unidades fuertes) y varias unidades que no corresponden realmente con ninguna de las observaciones (unidades débiles). Las unidades fuertes (y, en ocasiones, algunas unidades consecutivas a ellas en la cuadrícula) representan posibles centros de clústeres.

Otro uso de las redes de Kohonen es el de la reducción de dimensión. La característica espacial de las cuadrículas bidimensionales permite una correlación desde los predictores originales k a dos características derivadas que conservan las relaciones de similitud de los predictores originales. En algunos casos, esto puede ofrecer el mismo tipo de ventaja que el análisis factorial o PCA.

Tenga en cuenta que el método para calcular el tamaño predeterminado de la cuadrícula de resultados es diferente de las versiones anteriores de SPSS Modeler. El método suele generar capas de salida más pequeñas, que se entrenan más rápidamente y se generalizan mejor. Si obtiene unos resultados no significativos con el tamaño predeterminado, intente aumentar el tamaño de la cuadrícula de salida en el separador Experto.

Requisitos. Para entrenar una red Kohonen, necesita uno o más campos con el rol establecido en Input. Los campos con el rol establecido en Target, Botho None se ignoran.

Puntos fuertes. No es necesario tener los datos en pertenencia a grupos para crear un modelo de red de Kohonen. Ni siquiera necesita saber el número de grupos que buscar. Las redes de Kohonen comienzan con un número elevado de unidades y, según avanza el entrenamiento, las unidades se dejan atraer por los clústeres naturales de los datos. Puede mirar el número de observaciones capturadas por cada unidad en el nugget de modelo para identificar las unidades fuertes, las cuales pueden darle una idea del número adecuado de clústeres.