Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12 sty 2023
Regresja logistyczna to technika statystyczna umożliwiająca klasyfikację rekordów na podstawie wartości zmiennych wejściowych. Jest ona analogiczna do regresji liniowej, lecz bazuje na przewidywanej zmiennej jakościowej zamiast na rozstępie liczbowym.
Przykład dla funkcji wielomianowej
node = stream.create("logreg", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["BP", "Cholesterol", "Age"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Log_reg Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("method", "Stepwise")
node.setPropertyValue("logistic_procedure", "Multinomial")
node.setPropertyValue("multinomial_base_category", "BP")
node.setPropertyValue("model_type", "FullFactorial")
node.setPropertyValue("custom_terms", [["BP", "Sex"], ["Age"], ["Na", "K"]])
node.setPropertyValue("include_constant", False)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("scale", "Pearson")
node.setPropertyValue("scale_value", 3.0)
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("tolerance", "1.0E-7")
# "Convergence..." section
node.setPropertyValue("max_iterations", 50)
node.setPropertyValue("max_steps", 3)
node.setPropertyValue("l_converge", "1.0E-3")
node.setPropertyValue("p_converge", "1.0E-7")
node.setPropertyValue("delta", 0.03)
# "Output..." section
node.setPropertyValue("summary", True)
node.setPropertyValue("likelihood_ratio", True)
node.setPropertyValue("asymptotic_correlation", True)
node.setPropertyValue("goodness_fit", True)
node.setPropertyValue("iteration_history", True)
node.setPropertyValue("history_steps", 3)
node.setPropertyValue("parameters", True)
node.setPropertyValue("confidence_interval", 90)
node.setPropertyValue("asymptotic_covariance", True)
node.setPropertyValue("classification_table", True)
# "Stepping" options
node.setPropertyValue("min_terms", 7)
node.setPropertyValue("use_max_terms", True)
node.setPropertyValue("max_terms", 10)
node.setPropertyValue("probability_entry", 3)
node.setPropertyValue("probability_removal", 5)
node.setPropertyValue("requirements", "Containment")
Przykład dla funkcji dwumianowej
node = stream.create("logreg", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Cholesterol")
node.setPropertyValue("inputs", ["BP", "Drug", "Age"])
node.setPropertyValue("partition", "Test")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "Log_reg Cholesterol")
node.setPropertyValue("multinomial_base_category", "BP")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("binomial_method", "Forwards")
node.setPropertyValue("logistic_procedure", "Binomial")
node.setPropertyValue("binomial_categorical_input", "Sex")
node.setKeyedPropertyValue("binomial_input_contrast", "Sex", "Simple")
node.setKeyedPropertyValue("binomial_input_category", "Sex", "Last")
node.setPropertyValue("include_constant", False)
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("scale", "Pearson")
node.setPropertyValue("scale_value", 3.0)
node.setPropertyValue("all_probabilities", True)
node.setPropertyValue("tolerance", "1.0E-7")
# "Convergence..." section
node.setPropertyValue("max_iterations", 50)
node.setPropertyValue("l_converge", "1.0E-3")
node.setPropertyValue("p_converge", "1.0E-7")
# "Output..." section
node.setPropertyValue("binomial_output_display", "at_each_step")
node.setPropertyValue("binomial_goodness_of_fit", True)
node.setPropertyValue("binomial_iteration_history", True)
node.setPropertyValue("binomial_parameters", True)
node.setPropertyValue("binomial_ci_enable", True)
node.setPropertyValue("binomial_ci", 85)
# "Stepping" options
node.setPropertyValue("binomial_removal_criterion", "LR")
node.setPropertyValue("binomial_probability_removal", 0.2)
Właściwości węzła logregnode |
Wartości | Opis właściwości |
---|---|---|
target |
field (pole) | Modele regresji logistycznej wymagają jednej zmiennej przewidywanej i co najmniej jednej zmiennej wejściowej. Zmienne częstości i ważące nie są używane. Więcej informacji na ten temat zawiera sekcja Właściwości wspólnego węzła modelowania . |
logistic_procedure |
Binomial Multinomial |
|
include_constant |
flaga | |
mode |
Simple Expert |
|
method |
Enter Stepwise Forwards Backwards BackwardsStepwise |
|
binomial_method |
Enter Forwards Backwards |
|
model_type |
MainEffects FullFactorial Custom |
Jeśli jako typ modelu określono wartość FullFactorial , metody krokowe nie będą uruchamiane, nawet jeśli zostaną określone. Zamiast nich stosowana będzie metoda Enter . Jeśli jako typ modelu wybrano Custom , ale nie określono zmiennych niestandardowych, zbudowany zostanie model efektów głównych. |
custom_terms |
[[ Płeć Partnera] [ BP] [ Wiek]] | |
multinomial_base_category |
łańcuch | Określa sposób ustalania kategorii odniesienia. |
binomial_categorical_input |
łańcuch | |
binomial_input_contrast |
Indicator Simple Difference Helmert Repeated Polynomial Deviation |
Właściwość wprowadzana dla zmiennych jakościowych, która określa sposób wyznaczania kontrastu. Przykład zastosowania podano poniżej. |
binomial_input_category |
First Last |
Właściwość wprowadzana dla zmiennych jakościowych, która określa sposób wyznaczania kategorii odniesienia. Przykład zastosowania podano poniżej. |
scale |
None UserDefined Pearson Deviance |
|
scale_value |
Liczba | |
all_probabilities |
flaga | |
tolerance |
1.0E-5 1.0E-6 1.0E-7 1.0E-8 1.0E-9 1.0E-10 |
|
min_terms |
Liczba | |
use_max_terms |
flaga | |
max_terms |
Liczba | |
entry_criterion |
Score LR |
|
removal_criterion |
LR Wald |
|
probability_entry |
Liczba | |
probability_removal |
Liczba | |
binomial_probability_entry |
Liczba | |
binomial_probability_removal |
Liczba | |
requirements |
HierarchyDiscrete HierarchyAll Containment None |
|
max_iterations |
Liczba | |
max_steps |
Liczba | |
p_converge |
1.0E-4 1.0E-5 1.0E-6 1.0E-7 1.0E-8 0 |
|
l_converge |
1.0E-1 1.0E-2 1.0E-3 1.0E-4 1.0E-5 0 |
|
delta |
Liczba | |
iteration_history |
flaga | |
history_steps |
Liczba | |
summary |
flaga | |
likelihood_ratio |
flaga | |
asymptotic_correlation |
flaga | |
goodness_fit |
flaga | |
parameters |
flaga | |
confidence_interval |
Liczba | |
asymptotic_covariance |
flaga | |
classification_table |
flaga | |
stepwise_summary |
flaga | |
info_criteria |
flaga | |
monotonicity_measures |
flaga | |
binomial_output_display |
at_each_step at_last_step |
|
binomial_goodness_of_fit |
flaga | |
binomial_parameters |
flaga | |
binomial_iteration_history |
flaga | |
binomial_classification_plots |
flaga | |
binomial_ci_enable |
flaga | |
binomial_ci |
Liczba | |
binomial_residual |
outliers all |
|
binomial_residual_enable |
flaga | |
binomial_outlier_threshold |
Liczba | |
binomial_classification_cutoff |
Liczba | |
binomial_removal_criterion |
LR Wald Conditional |
|
calculate_variable_importance |
flaga | |
calculate_raw_propensities |
flaga |