Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
Logistická regrese je statistická technika pro klasifikaci záznamů na základě hodnot vstupních polí. Je analogický k lineární regresi, ale vezme kategorické cílové pole místo číselného rozsahu.
Multinomický příklad
node = stream.create("logreg", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["BP", "Cholesterol", "Age"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Log_reg Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("method", "Stepwise")
node.setPropertyValue("logistic_procedure", "Multinomial")
node.setPropertyValue("multinomial_base_category", "BP")
node.setPropertyValue("model_type", "FullFactorial")
node.setPropertyValue("custom_terms", [["BP", "Sex"], ["Age"], ["Na", "K"]])
node.setPropertyValue("include_constant", False)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("scale", "Pearson")
node.setPropertyValue("scale_value", 3.0)
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("tolerance", "1.0E-7")
# "Convergence..." section
node.setPropertyValue("max_iterations", 50)
node.setPropertyValue("max_steps", 3)
node.setPropertyValue("l_converge", "1.0E-3")
node.setPropertyValue("p_converge", "1.0E-7")
node.setPropertyValue("delta", 0.03)
# "Output..." section
node.setPropertyValue("summary", True)
node.setPropertyValue("likelihood_ratio", True)
node.setPropertyValue("asymptotic_correlation", True)
node.setPropertyValue("goodness_fit", True)
node.setPropertyValue("iteration_history", True)
node.setPropertyValue("history_steps", 3)
node.setPropertyValue("parameters", True)
node.setPropertyValue("confidence_interval", 90)
node.setPropertyValue("asymptotic_covariance", True)
node.setPropertyValue("classification_table", True)
# "Stepping" options
node.setPropertyValue("min_terms", 7)
node.setPropertyValue("use_max_terms", True)
node.setPropertyValue("max_terms", 10)
node.setPropertyValue("probability_entry", 3)
node.setPropertyValue("probability_removal", 5)
node.setPropertyValue("requirements", "Containment")
Příklad pro Binomické
node = stream.create("logreg", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Cholesterol")
node.setPropertyValue("inputs", ["BP", "Drug", "Age"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "Log_reg Cholesterol")
node.setPropertyValue("multinomial_base_category", "BP")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("binomial_method", "Forwards")
node.setPropertyValue("logistic_procedure", "Binomial")
node.setPropertyValue("binomial_categorical_input", "Sex")
node.setKeyedPropertyValue("binomial_input_contrast", "Sex", "Simple")
node.setKeyedPropertyValue("binomial_input_category", "Sex", "Last")
node.setPropertyValue("include_constant", False)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("scale", "Pearson")
node.setPropertyValue("scale_value", 3.0)
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("tolerance", "1.0E-7")
# "Convergence..." section
node.setPropertyValue("max_iterations", 50)
node.setPropertyValue("l_converge", "1.0E-3")
node.setPropertyValue("p_converge", "1.0E-7")
# "Output..." section
node.setPropertyValue("binomial_output_display", "at_each_step")
node.setPropertyValue("binomial_goodness_of_fit", True)
node.setPropertyValue("binomial_iteration_history", True)
node.setPropertyValue("binomial_parameters", True)
node.setPropertyValue("binomial_ci_enable", True)
node.setPropertyValue("binomial_ci", 85)
# "Stepping" options
node.setPropertyValue("binomial_removal_criterion", "LR")
node.setPropertyValue("binomial_probability_removal", 0.2)
logregnode Vlastnosti |
Hodnoty | Popis vlastnosti |
---|---|---|
target |
pole | Logistické regresní modely vyžadují jedno cílové pole a jedno nebo více vstupních polí. Pole frekvence a váha se nepoužívají. Další informace naleznete v tématu Obecné vlastnosti uzlu modelování . |
logistic_procedure |
Binomial Multinomial |
|
include_constant |
příznak | |
mode |
Simple Expert |
|
method |
Enter Stepwise Forwards Backwards BackwardsStepwise |
|
binomial_method |
Enter Forwards Backwards |
|
model_type |
MainEffects FullFactorial Custom |
Je-li jako typ modelu zadána hodnota FullFactorial , metody krokování nebudou spuštěny, i když jsou zadány. Místo toho bude použita metoda Enter . Je-li typ modelu nastaven na Custom , ale nejsou zadána žádná vlastní pole, bude sestaven model s hlavní účinky. |
custom_terms |
[[ BP Sex] [ BP] [ Věk]] | |
multinomial_base_category |
řetězec | Uvádí, jak je určena kategorie odkazů. |
binomial_categorical_input |
řetězec | |
binomial_input_contrast |
Indicator Simple Difference Helmert Repeated Polynomial Deviation |
Klíčovaná vlastnost pro kategorický vstup, která uvádí, jak je kontrast určen. Viz příklad použití. |
binomial_input_category |
First Last |
Klíčovaná vlastnost pro kategorický vstup, která uvádí, jak je určena kategorie odkazů. Viz příklad použití. |
scale |
None UserDefined Pearson Deviance |
|
scale_value |
Číslo | |
all_probabilities |
příznak | |
tolerance |
1.0E-5 1.0E-6 1.0E-7 1.0E-8 1.0E-9 1.0E-10 |
|
min_terms |
Číslo | |
use_max_terms |
příznak | |
max_terms |
Číslo | |
entry_criterion |
Score LR |
|
removal_criterion |
LR Wald |
|
probability_entry |
Číslo | |
probability_removal |
Číslo | |
binomial_probability_entry |
Číslo | |
binomial_probability_removal |
Číslo | |
requirements |
HierarchyDiscrete HierarchyAll Containment None |
|
max_iterations |
Číslo | |
max_steps |
Číslo | |
p_converge |
1.0E-4 1.0E-5 1.0E-6 1.0E-7 1.0E-8 0 |
|
l_converge |
1.0E-1 1.0E-2 1.0E-3 1.0E-4 1.0E-5 0 |
|
delta |
Číslo | |
iteration_history |
příznak | |
history_steps |
Číslo | |
summary |
příznak | |
likelihood_ratio |
příznak | |
asymptotic_correlation |
příznak | |
goodness_fit |
příznak | |
parameters |
příznak | |
confidence_interval |
Číslo | |
asymptotic_covariance |
příznak | |
classification_table |
příznak | |
stepwise_summary |
příznak | |
info_criteria |
příznak | |
monotonicity_measures |
příznak | |
binomial_output_display |
at_each_step at_last_step |
|
binomial_goodness_of_fit |
příznak | |
binomial_parameters |
příznak | |
binomial_iteration_history |
příznak | |
binomial_classification_plots |
příznak | |
binomial_ci_enable |
příznak | |
binomial_ci |
Číslo | |
binomial_residual |
outliers all |
|
binomial_residual_enable |
příznak | |
binomial_outlier_threshold |
Číslo | |
binomial_classification_cutoff |
Číslo | |
binomial_removal_criterion |
LR Wald Conditional |
|
calculate_variable_importance |
příznak | |
calculate_raw_propensities |
příznak |