0 / 0
Torna alla versione inglese della documentazione
proprietà hdbscannode
Ultimo aggiornamento: 07 ott 2024
proprietà hdbscannode

Icona nodo HDBSCANHDBSCAN© (Hierarchical Density-Based Spatial Clustering) utilizza un apprendimento non supervisionato per trovare i cluster, o dense regioni, di un dataset. Il nodo HDBSCAN in SPSS Modeler espone le funzioni principali e i parametri comunemente utilizzati della libreria HDBSCAN. Il nodo viene implementato in Python ed è possibile utilizzarlo per raggruppare i dataset in gruppi distinti quando non si è in grado di definire all'inizio le caratteristiche di tali gruppi.

Tabella 1. proprietà hdbscannode
proprietà hdbscannode Tipo di dati Descrizione proprietà
campo_personalizzati booleano Questa opzione indica al nodo di utilizzare le informazioni sui campi specificate qui al posto di quelle date in un qualsiasi nodo Tipo upstream. Dopo aver selezionato questa opzione, specificare i seguenti campi come richiesto.
inputs campo Campi di input per il raggruppamento tramite cluster
useHPO booleano Specificare true o false per abilitare o disabilitare HPO (Hyper - Parameter Optimization) in base a Rbfopt, che rileva automaticamente la combinazione ottimale di parametri in modo che il modello raggiunga il tasso di errore previsto o inferiore sui campioni. Il valore predefinito è false.
min_cluster_size intero La dimensione minima dei cluster. Specificare un numero intero. Il valore predefinito è 5.
min_samples intero Il numero minimo di campioni in una risorsa per un punto da considerare un punto centrale. Specificare un numero intero. Se impostato su 0, viene utilizzato min_cluster_size. Il valore predefinito è 0.
algorithm Stringa Specificare l'algoritmo da utilizzare: best, generic, prims_kdtree, prims_balltree, boruvka_kdtree o boruvka_balltree. L'impostazione di default è best.
metric Stringa Specificare la metrica da utilizzare nel calcolo della distanza tra le istanze in un array di funzioni: euclidean, cityblock, L1, L2, manhattan, braycurtis, canberra, chebyshev, correlation, minkowski, o sqeuclidean. Il valore predefinito è euclidean.
useStringLabel booleano Specificare true per utilizzare un'etichetta del cluster di stringhe oppure false per utilizzare un'etichetta cluster di numeri. Il valore predefinito è false.
stringLabelPrefix Stringa Se il parametro useStringLabel è impostato su true, specificare un valore per il prefisso dell'etichetta della stringa. Il valore predefinito è cluster.
approx_min_span_tree booleano Specificare true per accettare una struttura ad albero minima approssimata o false se si privilegia la correttezza respetto alla velocità. Il valore predefinito è true.
cluster_selection_method Stringa Specificare il metodo da utilizzare per la selezione dei cluster dalla struttura ad albero condensata: eom o leaf. Il valore predefinito è eom (algoritmo Excess of Mass).
allow_single_cluster booleano Specificare true se si desidera consentire i risultati di un singolo cluster. L'impostazione predefinita è false.
p_value doppio Specificare il p value da utilizzare se si sta utilizzando minkowski per la metrica. Il valore predefinito è 1.5.
leaf_size intero Se si utilizza un algoritmo di struttura ad albero dello spazio (boruvka_kdtree, or boruvka_balltree), specificare il numero di punti in un nodo foglia della struttura ad albero. Il valore predefinito è 40.
outputValidity booleano Specificare true o false per controllare se il grafico dell'Indice di validità è incluso nell'output del modello.
outputCondensed booleano Specificare true o false per controllare se il grafico della Struttura ad albero condensata è incluso nell'output del modello.
outputSingleLinkage booleano Specificare true o false per controllare se il grafico della Struttura ad albero collegamento singolo è incluso nell'output del modello.
outputMinSpan booleano Specificare true o false per controllare se il grafico della Struttura ad albero minima è incluso nell'output del modello.
is_split
Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni