Torna alla versione inglese della documentazioneproprietà autoclassifiernode
proprietà autoclassifiernode
Ultimo aggiornamento: 07 ott 2024
Il nodo Classificatore automatico crea e confronta svariati tipi di modelli per risultati binari (sì o no, abbandono oppure no e così via), consentendo di scegliere l'approccio migliore per una determinata analisi. Sono supportati numerosi algoritmi di modellazione ed è possibile selezionare i metodi da utilizzare, le opzioni specifiche per ognuno di essi e i criteri per confrontare i risultati. Il nodo genera un insieme di modelli basato sulle opzioni specificate e classifica i candidati migliori in base ai criteri indicati.
Esempio
node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)
Proprietà autoclassifiernode |
Valori | Descrizione proprietà |
---|---|---|
target |
campo | Per i campi obiettivo, il nodo Classificatore automatico richiede un solo campo obiettivo e uno o più campi di input. È inoltre possibile specificare i campi frequenza e peso. Per ulteriori informazioni, consultare Proprietà comuni del nodo Modelli . |
ranking_measure |
Accuracy Area_under_curve Profit Lift Num_variables |
|
ranking_dataset |
Training Test |
|
number_of_models |
intero | Numero dei modelli da includere nel nugget del modello. Specificare un numero intero compreso fra 1 e 100. |
calculate_variable_importance |
indicatore | |
enable_accuracy_limit |
indicatore | |
accuracy_limit |
intero | Numero intero compreso fra 0 e 100. |
enable_area_under_curve_limit |
indicatore | |
area_under_curve_limit |
numero | Numero reale compreso tra 0.0 e 1.0. |
enable_profit_limit |
indicatore | |
profit_limit |
numero | Numero intero maggiore di 0. |
enable_lift_limit |
indicatore | |
lift_limit |
numero | Numero reale maggiore di 1.0. |
enable_number_of_variables_limit |
indicatore | |
number_of_variables_limit |
numero | Numero intero maggiore di 0. |
use_fixed_cost |
indicatore | |
fixed_cost |
numero | Numero reale maggiore di 0.0. |
variable_cost |
campo | |
use_fixed_revenue |
indicatore | |
fixed_revenue |
numero | Numero reale maggiore di 0.0. |
variable_revenue |
campo | |
use_fixed_weight |
indicatore | |
fixed_weight |
numero | Numero reale maggiore di 0,0. |
variable_weight |
campo | |
lift_percentile |
numero | Numero intero compreso fra 0 e 100. |
enable_model_build_time_limit |
indicatore | |
model_build_time_limit |
numero | Numero intero impostato sul numero di minuti per limitare il tempo impiegato per creare ogni singolo modello. |
enable_stop_after_time_limit |
indicatore | |
stop_after_time_limit |
numero | Numero reale impostato sul numero di ore per limitare il tempo complessivo impiegato per l'esecuzione di un classificatore automatico. |
enable_stop_after_valid_model_produced |
indicatore | |
use_costs |
indicatore | |
<algorithm> |
indicatore | Abilita o disabilita l'utilizzo di un algoritmo specifico. |
<algorithm>.<property> |
Stringa | Imposta il valore di una proprietà di un algoritmo specifico. Per ulteriori informazioni, consultare Impostazione delle proprietà dell'algoritmo . |
use_cross_validation |
campo | I campi aggiunti a questo elenco possono acquisire il ruolo Condizione o Previsione dalle regole generate dal modello. Ciò viene determinato regola per regola, pertanto un campo potrebbe essere una condizione in una regola e una previsione in un'altra. |
number_of_folds |
intero | Parametro N ricorrenze per convalida incrociata, compreso tra 3 e 10. |
set_random_seed |
booleano | L'impostazione di un seed casuale consente di replicare le analisi. Specificare un intero o fare clic su Genera per creare un intero pseudocasuale compreso tra 1 e 2147483647 incluso. Per impostazione predefinita, le analisi vengono replicate con il seed 229176228. |
random_seed |
intero | Seed casuale |
stop_if_valid_model |
booleano | |
filter_individual_model_output |
booleano | Elimina dall'output tutti i campi aggiuntivi generati dai singoli modelli che alimentano il nodo Insieme. Selezionare questa opzione se si è interessati solo al punteggio combinato da tutti i modelli di input. Assicurarsi che questa opzione sia deselezionata se, ad esempio, si desidera utilizzare un nodo Analisi o Valutazione per confrontare la precisione del punteggio combinato con quella di ciascuno dei singoli modelli di input |
set_ensemble_method |
"Voting" |
Metodo dell'insieme per le destinazioni impostate. |
set_voting_tie_selection |
"Random" |
Se il voto è pari merito, selezionare il valore in modo casuale o utilizzando la massima confidenza. |
flag_ensemble_method |
"Voting" |
Metodo dell'insieme per gli obiettivi flag. |
flag_voting_tie_selection |
"Random" |
Se il voto è pari merito, selezionare il valore in modo casuale, con la massima confidenza o con la propensione grezza. |