0 / 0
Torna alla versione inglese della documentazione
Nodo HDBSCAN
Ultimo aggiornamento: 22 nov 2024
Nodo HDBSCAN (SPSS Modeler)

HDBSCAN© (Hierarchical Density-Based Spatial Clustering) utilizza un apprendimento non supervisionato per trovare i cluster, o dense regioni, di un dataset.

Il nodo HDBSCAN in 'watsonx.ai Studio espone le caratteristiche principali e i parametri comunemente usati della libreria HDBSCAN. Il nodo viene implementato in Python ed è possibile utilizzarlo per raggruppare i dataset in gruppi distinti quando non si è in grado di definire all'inizio le caratteristiche di tali gruppi. A differenza della maggior parte dei metodi di apprendimento in 'watsonx.ai Studio, i modelli HDBSCAN non utilizzano un campo di destinazione. Questo tipo di apprendimento, privo di campi obiettivo, viene chiamato apprendimento non supervisionato. Piuttosto che cercare di prevedere un risultato, HDBSCAN tenta di scoprire gli schemi nell'insieme di campi di input. I record vengono raggruppati in modo che quelli simili si trovino nello stesso gruppo o cluster e quelli dissimili in gruppi diversi. L'algoritmo HDBSCAN visualizza i cluster come aree ad alta densità separati da aree a bassa densità. A causa di questa visualizzazione piuttosto generica, i cluster trovati da HDBSCAN possono essere in qualsiasi forma, in contrapposizione a medie-k che suppongono che i cluster siano di forma convessa. Vengono contrassegnati anche i punti dei valori anomali che risiedono da soli nelle regioni a bassa densità. HDBSCAN supporta anche il calcolo del punteggio di nuovi esempi.1

Per utilizzare il nodo HDBSCAN, è necessario impostare un nodo Tipo upstream. Il nodo HDBSCAN leggerà i valori di input dal nodo Tipo (o dai Tipi di un nodo di importazione upstream).

Per ulteriori informazioni sugli algoritmi di clustering HDBSCAN, consultare la documentazione di HDBSCAN. 1

1 "Guida utente / Tutorial." Libreria di cluster hdbscan. Web. © 2016, Leland McInnes, John Healy, Steve Astels.

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni