Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12 sty 2023
Metoda K-średnich jest jednym z najczęściej używanych algorytmów grupowania. Grupuje ona punkty danych w predefiniowanej liczbie skupień. Węzeł K-Średnie-AS w programie SPSS Modeler jest implementowany w programie Spark. Szczegółowe informacje na temat algorytmów K-średnich można znaleźć pod adresem https://spark.apache.org/docs/2.2.0/ml-clustering.html. Należy zwrócić uwagę, że węzeł K-średnie-AS automatycznie wykonuje kodowanie one-hot (kodowanie z gorącą jedynką) dla zmiennych kategorialnych.
Właściwości węzła kmeansasnode |
Wartości | Opis właściwości |
---|---|---|
roleUse |
łańcuch | Określenie wartości predefined pozwala na użycie ról predefiniowanych, a wartości custom na użycie niestandardowych przypisań zmiennych. Wartością domyślną jest predefined . |
autoModel |
Wartość boolowska | Określ true , aby użyć nazwy domyślnej ($S-prediction ) dla nowo wygenerowanej zmiennej oceny, lub false , aby użyć nazwy niestandardowej. Wartością domyślną jest true . |
features |
field (pole) | Lista nazw zmiennych wejściowych, gdy właściwość roleUse jest ustawiona na wartość custom . |
name |
łańcuch | Nazwa nowo wygenerowanej zmiennej oceny, gdy właściwość autoModel jest ustawiona na false . |
clustersNum |
liczba całkowita | Liczba skupień do utworzenia. Wartością domyślną jest 5 . |
initMode |
łańcuch | Algorytm inicjowania. Możliwe wartości to k-means|| i random . Wartością domyślną jest k-means|| . |
initSteps |
liczba całkowita | Liczba kroków inicjowania, gdy właściwość initMode jest ustawiona na k-means|| . Wartość domyślna to 2 . |
advancedSettings |
Wartość boolowska | Określ true , aby udostępnić następujące cztery właściwości. Wartością domyślną jest false . |
maxIteration |
liczba całkowita | Maksymalna liczba iteracji podczas grupowania. Wartością domyślną jest 20 . |
tolerance |
łańcuch | Tolerancja zatrzymania iteracji. Dozwolone są następujące ustawienia: 1.0E-1 , 1.0E-2 , ..., 1.0E-6 . Wartością domyślną jest 1.0E-4 . |
setSeed |
Wartość boolowska | Określ wartość true , aby użyć własnej wartości początkowej dla generatora liczb losowych. Wartością domyślną jest false . |
randomSeed |
liczba całkowita | Niestandardowa wartość początkowa generatora liczb losowych, gdy właściwość setSeed ma wartość true . |
displayGraph |
Wartość boolowska | Wybierz tę opcję, jeśli wyniki mają zawierać wykres. |