코호넨 네트워크는 knet 또는 자가 조직 맵이라고도 하며 군집화를 수행하는 신경망의 한 유형입니다. 이 유형의 네트워크는 초기에 그룹이 어떤 그룹인지 모를 때 데이터 세트를 구별되는 그룹으로 군집화하는 데 사용할 수 있습니다. 레코드가 그룹화되므로 그룹 또는 군집 내 레코드는 서로 유사한 경향이 있지만, 다른 그룹의 레코드는 비슷하지 않습니다.
기본 단위는 뉴런이며 두 개의 레이어, 입력층 및 출력층(출력 맵이라고도 함)으로 구성됩니다. 모든 입력 뉴런은 전체 출력 뉴런에 연결되고 연결은 연관된 강도 또는 가중값이 있습니다. 훈련 중에는 각 단위가 각 레코드에서 "우승"하기 위해 다른 모든 단위와 서로 경쟁합니다.
출력 맵은 단위가 서로 연결되지 않은 뉴런의 2차원 눈금입니다.
입력 데이터는 입력층에 표시되고 값은 출력층으로 전파됩니다. 반응이 가장 강력한 출력 뉴런은 승자라고 하며 해당 입력의 답이 됩니다.
처음에는 모든 가중치가 무작위입니다. 한 단위가 레코드에서 우승하면 가중값(집합적으로 이웃 항목이라 부르는 다른 근처의 단위 가중값과 함께)이 해당 레코드의 예측자 값 패턴에 더 일치하도록 조정됩니다. 모든 입력 레코드가 표시되고 이에 따라 가중값이 업데이트됩니다. 이 프로세스는 변경이 매우 적게 될 때까지 여러 번 반복됩니다. 훈련이 진행되면서 눈금 단위의 가중값은 군집의 2차원 "맵"(자가 조직 맵)을 형성하도록 조정됩니다.
네트워크가 완전히 훈련되면 유사한 레코드는 출력 맵에서 서로 가까워야 하는 반면에 아주 상이한 레코드는 멀리 떨어져 있습니다.
watsonx.ai의 대부분의 학습 방법과 달리, 코호넨 네트워크는 대상 필드를 사용하지 않습니다 . 대상 필드가 없는 이 학습 유형은 자율 학습이라고 합니다. 결과를 예측하는 대신, 코호넨 넷은 입력 필드 세트에서 패턴을 파악하려고 합니다. 일반적으로 코호넨 넷은 많은 관측(강력한 단위)을 요약하는 소수의 단위와 관측에 실제로 대응하지 않는 여러 단위(취약한 단위)로 종료됩니다. 강력한 단위(그리고 때때로 눈금에서 이들에 인접한 다른 단위)는 가능한 군집 중심을 나타냅니다.
다른 코호넨 네트워크의 사용은 차원 축소에서 찾을 수 있습니다. 2차원 눈금의 공간적 특성을 통해 k
원래 예측자에서, 원래 예측자와 유사 관계를 유지하는 2개의 파생된 기능으로의 맵핑을 제공합니다. 일부 경우에 이는 요인 분석 또는 PCA와 동일한 종류의 혜택을 제공할 수 있습니다.
출력 격자의 기본 크기를 계산하는 방법은 이전 버전의 SPSS Modeler와 다릅니다. 일반적으로 이 방법은 더 빠르게 훈련하고 더 효율적으로 일반화하기 위해 더 작은 출력 계층을 생성합니다. 기본 크기의 열악한 결과를 얻은 경우 고급 탭에서 출력 눈금의 크기를 늘리십시오.
요구사항. 코호넨 넷을 훈련하려면 역할이 Input
로 설정된 하나 이상의 필드가 필요합니다. 역할이 Target
, Both
또는 None
로 설정된 필드는 무시됩니다.
강도. 코호넨 네트워크 모델을 작성하기 위해 소속그룹에 데이터는 없어도 됩니다. 찾으려는 여러 그룹을 알지 않아도 됩니다. 코호넨 네트워크는 많은 수의 단위로 시작되고, 훈련이 진행되면 이 단위는 데이터에서 자연 군집 방향으로 이끌립니다. 강력한 단위를 식별하기 위해 모델 너깃에 있는 각 단위에서 캡처한 관측값 수를 살펴볼 수 있습니다. 이를 통해 적절한 군집 수를 파악할 수 있습니다.