Torna alla versione inglese della documentazioneproprietà logregnode
proprietà logregnode
Ultimo aggiornamento: 07 ott 2024
La regressione logistica, una tecnica statistica che consente di classificare i record in base ai valori dei campi di input, è analoga alla regressione lineare ma, al posto di un intervallo numerico, prende un campo obiettivo categoriale.
Esempio multinomiale
node = stream.create("logreg", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["BP", "Cholesterol", "Age"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Log_reg Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("method", "Stepwise")
node.setPropertyValue("logistic_procedure", "Multinomial")
node.setPropertyValue("multinomial_base_category", "BP")
node.setPropertyValue("model_type", "FullFactorial")
node.setPropertyValue("custom_terms", [["BP", "Sex"], ["Age"], ["Na", "K"]])
node.setPropertyValue("include_constant", False)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("scale", "Pearson")
node.setPropertyValue("scale_value", 3.0)
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("tolerance", "1.0E-7")
# "Convergence..." section
node.setPropertyValue("max_iterations", 50)
node.setPropertyValue("max_steps", 3)
node.setPropertyValue("l_converge", "1.0E-3")
node.setPropertyValue("p_converge", "1.0E-7")
node.setPropertyValue("delta", 0.03)
# "Output..." section
node.setPropertyValue("summary", True)
node.setPropertyValue("likelihood_ratio", True)
node.setPropertyValue("asymptotic_correlation", True)
node.setPropertyValue("goodness_fit", True)
node.setPropertyValue("iteration_history", True)
node.setPropertyValue("history_steps", 3)
node.setPropertyValue("parameters", True)
node.setPropertyValue("confidence_interval", 90)
node.setPropertyValue("asymptotic_covariance", True)
node.setPropertyValue("classification_table", True)
# "Stepping" options
node.setPropertyValue("min_terms", 7)
node.setPropertyValue("use_max_terms", True)
node.setPropertyValue("max_terms", 10)
node.setPropertyValue("probability_entry", 3)
node.setPropertyValue("probability_removal", 5)
node.setPropertyValue("requirements", "Containment")
Esempio binomiale
node = stream.create("logreg", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Cholesterol")
node.setPropertyValue("inputs", ["BP", "Drug", "Age"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "Log_reg Cholesterol")
node.setPropertyValue("multinomial_base_category", "BP")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("binomial_method", "Forwards")
node.setPropertyValue("logistic_procedure", "Binomial")
node.setPropertyValue("binomial_categorical_input", "Sex")
node.setKeyedPropertyValue("binomial_input_contrast", "Sex", "Simple")
node.setKeyedPropertyValue("binomial_input_category", "Sex", "Last")
node.setPropertyValue("include_constant", False)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("scale", "Pearson")
node.setPropertyValue("scale_value", 3.0)
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("tolerance", "1.0E-7")
# "Convergence..." section
node.setPropertyValue("max_iterations", 50)
node.setPropertyValue("l_converge", "1.0E-3")
node.setPropertyValue("p_converge", "1.0E-7")
# "Output..." section
node.setPropertyValue("binomial_output_display", "at_each_step")
node.setPropertyValue("binomial_goodness_of_fit", True)
node.setPropertyValue("binomial_iteration_history", True)
node.setPropertyValue("binomial_parameters", True)
node.setPropertyValue("binomial_ci_enable", True)
node.setPropertyValue("binomial_ci", 85)
# "Stepping" options
node.setPropertyValue("binomial_removal_criterion", "LR")
node.setPropertyValue("binomial_probability_removal", 0.2)
Proprietà logregnode |
Valori | Descrizione proprietà |
---|---|---|
target |
campo | I modelli di regressione logistica richiedono un solo campo obiettivo e uno o più campi di input. I campi frequenza e peso non sono utilizzati. Per ulteriori informazioni, consultare Proprietà comuni del nodo Modelli . |
logistic_procedure |
Binomial Multinomial |
|
include_constant |
indicatore | |
mode |
Simple Expert |
|
method |
Enter Stepwise Forwards Backwards BackwardsStepwise |
|
binomial_method |
Enter Forwards Backwards |
|
model_type |
MainEffects FullFactorial Custom |
Quando FullFactorial viene specificato come tipo di modello, i metodi di controllo non verranno eseguiti, anche se specificati. Verrà invece utilizzato il metodo Enter . Se il tipo di modello è impostato su Custom , ma non sono stati specificati campi personalizzati, verrà creato un modello effetti principali. |
custom_terms |
[[ Sesso BP] [ BP] [ Età]] | |
multinomial_base_category |
Stringa | Specifica come viene determinata la categoria di riferimento. |
binomial_categorical_input |
Stringa | |
binomial_input_contrast |
Indicator Simple Difference Helmert Repeated Polynomial Deviation |
Proprietà basata su chiavi per input categoriali che indica come viene determinato il confronto. Per l'utilizzo, vedere l'esempio. |
binomial_input_category |
First Last |
Proprietà basata su chiavi per input categoriali che indica come viene determinata la categoria di riferimento. Per l'utilizzo, vedere l'esempio. |
scale |
None UserDefined Pearson Deviance |
|
scale_value |
numero | |
all_probabilities |
indicatore | |
tolerance |
1.0E-5 1.0E-6 1.0E-7 1.0E-8 1.0E-9 1.0E-10 |
|
min_terms |
numero | |
use_max_terms |
indicatore | |
max_terms |
numero | |
entry_criterion |
Score LR |
|
removal_criterion |
LR Wald |
|
probability_entry |
numero | |
probability_removal |
numero | |
binomial_probability_entry |
numero | |
binomial_probability_removal |
numero | |
requirements |
HierarchyDiscrete HierarchyAll Containment None |
|
max_iterations |
numero | |
max_steps |
numero | |
p_converge |
1.0E-4 1.0E-5 1.0E-6 1.0E-7 1.0E-8 0 |
|
l_converge |
1.0E-1 1.0E-2 1.0E-3 1.0E-4 1.0E-5 0 |
|
delta |
numero | |
iteration_history |
indicatore | |
history_steps |
numero | |
summary |
indicatore | |
likelihood_ratio |
indicatore | |
asymptotic_correlation |
indicatore | |
goodness_fit |
indicatore | |
parameters |
indicatore | |
confidence_interval |
numero | |
asymptotic_covariance |
indicatore | |
classification_table |
indicatore | |
stepwise_summary |
indicatore | |
info_criteria |
indicatore | |
monotonicity_measures |
indicatore | |
binomial_output_display |
at_each_step at_last_step |
|
binomial_goodness_of_fit |
indicatore | |
binomial_parameters |
indicatore | |
binomial_iteration_history |
indicatore | |
binomial_classification_plots |
indicatore | |
binomial_ci_enable |
indicatore | |
binomial_ci |
numero | |
binomial_residual |
outliers all |
|
binomial_residual_enable |
indicatore | |
binomial_outlier_threshold |
numero | |
binomial_classification_cutoff |
numero | |
binomial_removal_criterion |
LR Wald Conditional |
|
calculate_variable_importance |
indicatore | |
calculate_raw_propensities |
indicatore |