proprietà hdbscannode
Ultimo aggiornamento: 11 feb 2025
HDBSCAN© (Hierarchical Density-Based Spatial Clustering) utilizza un apprendimento non supervisionato per trovare i cluster, o dense regioni, di un dataset. Il nodo HDBSCAN in SPSS Modeler espone le funzioni principali e i parametri comunemente utilizzati della libreria HDBSCAN. Il nodo viene implementato in Python ed è possibile utilizzarlo per raggruppare
i dataset in gruppi distinti quando non si è in grado di definire all'inizio le
caratteristiche di tali gruppi.
proprietà |
Tipo di dati | Descrizione proprietà |
---|---|---|
campo_personalizzati | booleano | Questa opzione indica al nodo di utilizzare le informazioni sui campi specificate qui al posto di quelle date in un qualsiasi nodo Tipo upstream. Dopo aver selezionato questa opzione, specificare i seguenti campi come richiesto. |
|
campo | Campi di input per il raggruppamento tramite cluster |
|
booleano | Specificare o per abilitare o disabilitare HPO (Hyper - Parameter Optimization) in base a Rbfopt, che rileva automaticamente la combinazione ottimale di parametri in modo che il modello raggiunga il tasso di errore previsto o inferiore sui campioni. Il valore predefinito è . |
|
intero | La dimensione minima dei cluster. Specificare un numero intero. Il valore predefinito è . |
|
intero | Il numero minimo di campioni in una risorsa per un punto da considerare un punto centrale. Specificare un numero intero. Se impostato su , viene utilizzato . Il valore predefinito è
. |
|
Stringa | Specificare l'algoritmo da utilizzare: , , , , o . L'impostazione di default è . |
|
Stringa | Specificare la metrica da utilizzare nel calcolo della distanza tra le istanze in un array di funzioni:
, , , ,
, , ,
, , , o
. Il valore predefinito è . |
|
booleano | Specificare per utilizzare un'etichetta del cluster di stringhe oppure per utilizzare un'etichetta cluster di numeri. Il valore predefinito è . |
|
Stringa | Se il parametro è impostato su , specificare un valore per il prefisso dell'etichetta della stringa. Il valore predefinito è . |
|
booleano | Specificare per accettare una struttura ad albero minima approssimata o se si privilegia la correttezza respetto alla velocità. Il valore predefinito è
. |
|
Stringa | Specificare il metodo da utilizzare per la selezione dei cluster dalla struttura ad albero condensata: o . Il valore predefinito è (algoritmo Excess of Mass). |
|
booleano | Specificare se si desidera consentire i risultati di un singolo cluster. L'impostazione predefinita è . |
|
doppio | Specificare il da utilizzare se si sta utilizzando per la metrica. Il valore predefinito è . |
|
intero | Se si utilizza un algoritmo di struttura ad albero dello spazio ( , or
), specificare il numero di punti in un nodo foglia della struttura ad albero. Il valore predefinito è . |
|
booleano | Specificare o per controllare se il grafico dell'Indice di validità è incluso nell'output del modello. |
|
booleano | Specificare o per controllare se il grafico della Struttura ad albero condensata è incluso nell'output del modello. |
|
booleano | Specificare o per controllare se il grafico della Struttura ad albero collegamento singolo è incluso nell'output del modello. |
|
booleano | Specificare o per controllare se il grafico della Struttura ad albero minima è incluso nell'output del modello. |
|
L'argomento è stato utile?
0/1000