Torna alla versione inglese della documentazioneproprietà autoclusternode
proprietà autoclusternode
Ultimo aggiornamento: 07 ott 2024
Il nodo Cluster automatico stima e confronta i modelli di cluster che identificano gruppi di record con caratteristiche simili. Il nodo funziona in modo analogo ad altri nodi Modelli automatici e consente di sperimentare varie combinazioni di opzioni in un singolo passaggio di modellazione. I modelli si possono confrontare utilizzando misure di base con cui tentare di filtrare e classificare l'utilità dei modelli di cluster e fornire una misura in base all'importanza di determinati campi.
Esempio
node = stream.create("autocluster", "My node")
node.setPropertyValue("ranking_measure", "Silhouette")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_silhouette_limit", True)
node.setPropertyValue("silhouette_limit", 5)
Proprietà autoclusternode |
Valori | Descrizione proprietà |
---|---|---|
evaluation |
campo | Nota: solo nodo Cluster automatico. Identifica il campo per cui verrà calcolato un valore di importanza. In alternativa, può essere utilizzato per identificare il modo in cui il cluster differenzia il valore di questo campo e, quindi, il modo in cui il modello eseguirà la previsione di questo campo.
|
ranking_measure |
Silhouette Num_clusters Size_smallest_cluster Size_largest_cluster Smallest_to_largest Importance |
|
ranking_dataset |
Training Test |
|
summary_limit |
intero | Numero dei modelli da elencare nel report. Specificare un numero intero compreso fra 1 e 100. |
enable_silhouette_limit |
indicatore | |
silhouette_limit |
intero | Numero intero compreso fra 0 e 100. |
enable_number_less_limit |
indicatore | |
number_less_limit |
numero | Numero reale compreso tra 0.0 e 1.0. |
enable_number_greater_limit |
indicatore | |
number_greater_limit |
numero | Numero intero maggiore di 0. |
enable_smallest_cluster_limit |
indicatore | |
smallest_cluster_units |
Percentage Counts |
|
smallest_cluster_limit_percentage |
numero | |
smallest_cluster_limit_count |
intero | Numero intero maggiore di 0. |
enable_largest_cluster_limit |
indicatore | |
largest_cluster_units |
Percentage Counts |
|
largest_cluster_limit_percentage |
numero | |
largest_cluster_limit_count |
intero | |
enable_smallest_largest_limit |
indicatore | |
smallest_largest_limit |
numero | |
enable_importance_limit |
indicatore | |
importance_limit_condition |
Greater_than Less_than |
|
importance_limit_greater_than |
numero | Numero intero compreso fra 0 e 100. |
importance_limit_less_than |
numero | Numero intero compreso fra 0 e 100. |
<algorithm> |
indicatore | Abilita o disabilita l'utilizzo di un algoritmo specifico. |
<algorithm>.<property> |
Stringa | Imposta il valore di una proprietà di un algoritmo specifico. Per ulteriori informazioni, consultare Impostazione delle proprietà dell'algoritmo . |
number_of_models |
intero | |
enable_model_build_time_limit |
booleano | (solo modelli K-Means, Kohonen, TwoStep, SVM, KNN, Bayes Net e Decision List) Imposta un limite di tempo massimo per un qualsiasi modello. Ad esempio, se un modello richiede un tempo di addestramento più lungo del previsto a causa di qualche interazione complessa, grazie a questa opzione è possibile evitare che l'operazione ritardi e blocchi l'esecuzione di tutta la modellazione. |
model_build_time_limit |
intero | Tempo impiegato per la creazione del modello. |
enable_stop_after_time_limit |
booleano | (Solo modelli di reti neurali, K-Means, Kohonen, TwoStep, SVM, KNN, Bayes Net e C&R Tree) Arresta un'esecuzione dopo un determinato numero di ore. Tutti i modelli generati fino a quel punto vengono inclusi nel nugget del modello, ma non vengono prodotti altri modelli. |
stop_after_time_limit |
doppio | Limite di runtime (ore). |
stop_if_valid_model |
booleano | Arresta un'esecuzione quando un modello supera tutti i criteri specificati nelle impostazioni di eliminazione. |