Torna alla versione inglese della documentazioneproprietà autonumericnode
proprietà autonumericnode
Ultimo aggiornamento: 07 ott 2024
Il nodo Numerico automatico stima e confronta i modelli per i risultati di intervalli numerici continui utilizzando svariati metodi. Il nodo funziona in modo analogo al nodo Classificatore automatico e consente di scegliere gli algoritmi da utilizzare e di sperimentare più combinazioni di opzioni in un singolo passaggio di modellazione. Gli algoritmi supportati includono reti neurali, C&R Tree, CHAID, regressione lineare, regressione lineare generalizzata e SVM (Support Vector Machine). I modelli si possono confrontare in base a correlazione, errore relativo o numero di variabili utilizzato.
Esempio
node = stream.create("autonumeric", "My node")
node.setPropertyValue("ranking_measure", "Correlation")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_correlation_limit", True)
node.setPropertyValue("correlation_limit", 0.8)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("neuralnetwork", True)
node.setPropertyValue("chaid", False)
Proprietà autonumericnode |
Valori | Descrizione proprietà |
---|---|---|
custom_fields |
indicatore | Se True (vero), saranno utilizzate le impostazioni personalizzate dei campi anziché le impostazioni del nodo Tipo. |
target |
campo | Il nodo Numerico automatico richiede un solo campo obiettivo e uno o più campi di input. È inoltre possibile specificare i campi frequenza e peso. Per ulteriori informazioni, consultare Proprietà comuni del nodo Modelli . |
inputs |
[field1 … field2] | |
partition |
campo | |
use_frequency |
indicatore | |
frequency_field |
campo | |
use_weight |
indicatore | |
weight_field |
campo | |
use_partitioned_data |
indicatore | Se viene definito un campo di partizione, solo i dati di addestramento vengono utilizzati per la creazione del modello. |
ranking_measure |
Correlation NumberOfFields |
|
ranking_dataset |
Test Training |
|
number_of_models |
intero | Numero dei modelli da includere nel nugget del modello. Specificare un numero intero compreso fra 1 e 100. |
calculate_variable_importance |
indicatore | |
enable_correlation_limit |
indicatore | |
correlation_limit |
intero | |
enable_number_of_fields_limit |
indicatore | |
number_of_fields_limit |
intero | |
enable_relative_error_limit |
indicatore | |
relative_error_limit |
intero | |
enable_model_build_time_limit |
indicatore | |
model_build_time_limit |
intero | |
enable_stop_after_time_limit |
indicatore | |
stop_after_time_limit |
intero | |
stop_if_valid_model |
indicatore | |
<algorithm> |
indicatore | Abilita o disabilita l'utilizzo di un algoritmo specifico. |
<algorithm>.<property> |
Stringa | Imposta il valore di una proprietà di un algoritmo specifico. Per ulteriori informazioni, consultare Impostazione delle proprietà dell'algoritmo . |
use_cross_validation |
booleano | Invece di utilizzare una partizione singola, viene utilizzata una partizione di convalida incrociata. |
number_of_folds |
intero | Parametro N ricorrenze per convalida incrociata, compreso tra 3 e 10. |
set_random_seed |
booleano | L'impostazione di un seed casuale consente di replicare le analisi. Specificare un intero o fare clic su Genera per creare un intero pseudocasuale compreso tra 1 e 2147483647 incluso. Per impostazione predefinita, le analisi vengono replicate con il seed 229176228. |
random_seed |
intero | Seed casuale |
filter_individual_model_output |
booleano | Elimina dall'output tutti i campi aggiuntivi generati dai singoli modelli che alimentano il nodo Insieme. Selezionare questa opzione se si è interessati solo al punteggio combinato da tutti i modelli di input. Verificare che questa opzione sia deselezionata se, per esempio, si desidera utilizzare un nodo Analisi o Valutazione per confrontare la precisione del punteggio combinato con quella dei singoli modelli di input. |
calculate_standard_error |
booleano | Per un obiettivo continuo (intervallo numerico), un calcolo di errore standard viene eseguito per impostazione predefinita per calcolare la differenza tra i valori misurati o stimati e i valori reali e per mostrare la corrispondenza di tali stime. |