Torna alla versione inglese della documentazioneproprietà kmeansasnode
proprietà kmeansasnode
Ultimo aggiornamento: 10 set 2024
K-Means è uno degli algoritmi di clustering più comunemente usati. Raggruppa i punti dati in un numero predefinito di cluster. Il nodo K-Means-AS in SPSS Modeler è implementato in Spark. Per ulteriori informazioni sugli algoritmi k-means, vedere Clustering.1
Nota: Il nodo K-Means-AS esegue automaticamente la codifica one-hot per le variabili categoriche.
Proprietàkmeansasnode |
Valori | Descrizione proprietà |
---|---|---|
roleUse |
Stringa | Specificare predefined per utilizzare i ruoli predefiniti oppure custom per utilizzare le assegnazioni di campo personalizzate. Il valore predefinito è predefined . |
autoModel |
Booleano | Specificare true per utilizzare il nome predefinito ($S-prediction ) per il nuovo campo di calcolo del punteggio generato, oppure false per utilizzare un nome personalizzato. Il valore predefinito è true . |
features |
campo | Elenco dei nomi dei campi per l'input quando la proprietà roleUse è impostata su
custom . |
name |
Stringa | Il nome del nuovo campo di calcolo del punteggio generato quando la proprietà autoModel è impostata su false . |
clustersNum |
intero | Il numero di cluster da creare. Il valore predefinito è 5 . |
initMode |
Stringa | L'algoritmo di inizializzazione. I valori possibili sono k-means|| o
random . Il valore predefinito è k-means|| . |
initSteps |
intero | Il numero di fasi di inizializzazione quando initMode è impostato su
k-means|| . Il valore predefinito è 2 . |
advancedSettings |
Booleano | Specificare true per rendere disponibili le seguenti quattro proprietà. L'impostazione predefinita è false . |
maxIteration |
intero | Numero massimo di iterazioni per l'ottimizzazione. Il valore predefinito è 20 . |
tolerance |
Stringa | La tolleranza per arrestare le iterazioni. Le impostazioni possibili sono 1.0E-1 , 1.0E-2 , ..., 1.0E-6 . Il valore predefinito è 1.0E-4 . |
setSeed |
Booleano | Specificare true per utilizzare un seed random. L'impostazione predefinita è false . |
randomSeed |
intero | Il seed random personalizzato quando la proprietà setSeed è
true . |
displayGraph |
Booleano | Selezionare questa opzione se si desidera includere un grafico nell'output. |
1 "Clustering - API basata su RDD" Apache Spark. MLlib: Guida principale. Agosto 2024.