Torna alla versione inglese della documentazioneproprietà hdbscannode
proprietà hdbscannode
Ultimo aggiornamento: 07 ott 2024
HDBSCAN© (Hierarchical Density-Based Spatial Clustering) utilizza un apprendimento non supervisionato per trovare i cluster, o dense regioni, di un dataset. Il nodo HDBSCAN in SPSS Modeler espone le funzioni principali e i parametri comunemente utilizzati della libreria HDBSCAN. Il nodo viene implementato in Python ed è possibile utilizzarlo per raggruppare i dataset in gruppi distinti quando non si è in grado di definire all'inizio le caratteristiche di tali gruppi.
proprietà hdbscannode |
Tipo di dati | Descrizione proprietà |
---|---|---|
campo_personalizzati | booleano | Questa opzione indica al nodo di utilizzare le informazioni sui campi specificate qui al posto di quelle date in un qualsiasi nodo Tipo upstream. Dopo aver selezionato questa opzione, specificare i seguenti campi come richiesto. |
inputs |
campo | Campi di input per il raggruppamento tramite cluster |
useHPO |
booleano | Specificare true o false per abilitare o disabilitare HPO (Hyper - Parameter Optimization) in base a Rbfopt, che rileva automaticamente la combinazione ottimale di parametri in modo che il modello raggiunga il tasso di errore previsto o inferiore sui campioni. Il valore predefinito è false . |
min_cluster_size |
intero | La dimensione minima dei cluster. Specificare un numero intero. Il valore predefinito è 5 . |
min_samples |
intero | Il numero minimo di campioni in una risorsa per un punto da considerare un punto centrale. Specificare un numero intero. Se impostato su 0 , viene utilizzato min_cluster_size . Il valore predefinito è
0 . |
algorithm |
Stringa | Specificare l'algoritmo da utilizzare: best , generic , prims_kdtree , prims_balltree , boruvka_kdtree o boruvka_balltree . L'impostazione di default è best . |
metric |
Stringa | Specificare la metrica da utilizzare nel calcolo della distanza tra le istanze in un array di funzioni:
euclidean , cityblock , L1 , L2 ,
manhattan , braycurtis , canberra ,
chebyshev , correlation , minkowski , o
sqeuclidean . Il valore predefinito è euclidean . |
useStringLabel |
booleano | Specificare true per utilizzare un'etichetta del cluster di stringhe oppure false per utilizzare un'etichetta cluster di numeri. Il valore predefinito è false . |
stringLabelPrefix |
Stringa | Se il parametro useStringLabel è impostato su true , specificare un valore per il prefisso dell'etichetta della stringa. Il valore predefinito è cluster . |
approx_min_span_tree |
booleano | Specificare true per accettare una struttura ad albero minima approssimata o false se si privilegia la correttezza respetto alla velocità. Il valore predefinito è
true . |
cluster_selection_method |
Stringa | Specificare il metodo da utilizzare per la selezione dei cluster dalla struttura ad albero condensata: eom o leaf . Il valore predefinito è eom (algoritmo Excess of Mass). |
allow_single_cluster |
booleano | Specificare true se si desidera consentire i risultati di un singolo cluster. L'impostazione predefinita è false . |
p_value |
doppio | Specificare il p value da utilizzare se si sta utilizzando minkowski per la metrica. Il valore predefinito è 1.5 . |
leaf_size |
intero | Se si utilizza un algoritmo di struttura ad albero dello spazio (boruvka_kdtree , or
boruvka_balltree ), specificare il numero di punti in un nodo foglia della struttura ad albero. Il valore predefinito è 40 . |
outputValidity |
booleano | Specificare true o false per controllare se il grafico dell'Indice di validità è incluso nell'output del modello. |
outputCondensed |
booleano | Specificare true o false per controllare se il grafico della Struttura ad albero condensata è incluso nell'output del modello. |
outputSingleLinkage |
booleano | Specificare true o false per controllare se il grafico della Struttura ad albero collegamento singolo è incluso nell'output del modello. |
outputMinSpan |
booleano | Specificare true o false per controllare se il grafico della Struttura ad albero minima è incluso nell'output del modello. |
is_split |