Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12 sty 2023
Węzeł Auto Data Prep (ADP) może analizować dane i określać poprawki, pola ekranowe, które są problematyczne lub nie mogą być przydatne, w razie potrzeby czerpią nowe atrybuty i poprawiają wydajność dzięki inteligentnym technikom przesiewowym i pobieranym z próbkowania. Węzła można użyć w sposób w pełni zautomatyzowany, pozwalając mu na wybór i zastosowanie poprawek lub można przejrzeć zmiany przed ich wprowadzeniem, aby je zaakceptować, odrzucić lub zmienić, jeśli będzie to koniczne.
Przykład
node = stream.create("autodataprep", "My node")
node.setPropertyValue("objective", "Balanced")
node.setPropertyValue("excluded_fields", "Filter")
node.setPropertyValue("prepare_dates_and_times", True)
node.setPropertyValue("compute_time_until_date", True)
node.setPropertyValue("reference_date", "Today")
node.setPropertyValue("units_for_date_durations", "Automatic")
Właściwości węzła autodataprepnode |
Typ danych | Opis właściwości |
---|---|---|
objective |
Balanced Speed Accuracy Custom |
|
custom_fields |
flaga | Wartość true umożliwia określenie zmiennej przewidywanej, wejściowej i innych zmiennych dla bieżącego węzła. Wartość false powoduje użycie bieżących ustawień z wcześniejszego węzła Typy. |
target |
field (pole) | Określa jedną zmienną przewidywaną. |
inputs |
[field1 ... poleN] | Zmienne wejściowe lub predyktory używane przez model. |
use_frequency |
flaga | |
frequency_field |
field (pole) | |
use_weight |
flaga | |
weight_field |
field (pole) | |
excluded_fields |
Filter None |
|
if_fields_do_not_match |
StopExecution ClearAnalysis |
|
prepare_dates_and_times |
flaga | Steruje dostępem do wszystkich zmiennych daty i czasu |
compute_time_until_date |
flaga | |
reference_date |
Today Fixed |
|
fixed_date |
Data | |
units_for_date_durations |
Automatic Fixed |
|
fixed_date_units |
Years Months Days |
|
compute_time_until_time |
flaga | |
reference_time |
CurrentTime Fixed |
|
fixed_time |
Czas | |
units_for_time_durations |
Automatic Fixed |
|
fixed_time_units |
Hours Minutes Seconds |
|
extract_year_from_date |
flaga | |
extract_month_from_date |
flaga | |
extract_day_from_date |
flaga | |
extract_hour_from_time |
flaga | |
extract_minute_from_time |
flaga | |
extract_second_from_time |
flaga | |
exclude_low_quality_inputs |
flaga | |
exclude_too_many_missing |
flaga | |
maximum_percentage_missing |
Liczba | |
exclude_too_many_categories |
flaga | |
maximum_number_categories |
Liczba | |
exclude_if_large_category |
flaga | |
maximum_percentage_category |
Liczba | |
prepare_inputs_and_target |
flaga | |
adjust_type_inputs |
flaga | |
adjust_type_target |
flaga | |
reorder_nominal_inputs |
flaga | |
reorder_nominal_target |
flaga | |
replace_outliers_inputs |
flaga | |
replace_outliers_target |
flaga | |
replace_missing_continuous_inputs |
flaga | |
replace_missing_continuous_target |
flaga | |
replace_missing_nominal_inputs |
flaga | |
replace_missing_nominal_target |
flaga | |
replace_missing_ordinal_inputs |
flaga | |
replace_missing_ordinal_target |
flaga | |
maximum_values_for_ordinal |
Liczba | |
minimum_values_for_continuous |
Liczba | |
outlier_cutoff_value |
Liczba | |
outlier_method |
Replace Delete |
|
rescale_continuous_inputs |
flaga | |
rescaling_method |
MinMax ZScore |
|
min_max_minimum |
Liczba | |
min_max_maximum |
Liczba | |
z_score_final_mean |
Liczba | |
z_score_final_sd |
Liczba | |
rescale_continuous_target |
flaga | |
target_final_mean |
Liczba | |
target_final_sd |
Liczba | |
transform_select_input_fields |
flaga | |
maximize_association_with_target |
flaga | |
p_value_for_merging |
Liczba | |
merge_ordinal_features |
flaga | |
merge_nominal_features |
flaga | |
minimum_cases_in_category |
Liczba | |
bin_continuous_fields |
flaga | |
p_value_for_binning |
Liczba | |
perform_feature_selection |
flaga | |
p_value_for_selection |
Liczba | |
perform_feature_construction |
flaga | |
transformed_target_name_extension |
łańcuch | |
transformed_inputs_name_extension |
łańcuch | |
constructed_features_root_name |
łańcuch | |
years_duration_ name_extension |
łańcuch | |
months_duration_ name_extension |
łańcuch | |
days_duration_ name_extension |
łańcuch | |
hours_duration_ name_extension |
łańcuch | |
minutes_duration_ name_extension |
łańcuch | |
seconds_duration_ name_extension |
łańcuch | |
year_cyclical_name_extension |
łańcuch | |
month_cyclical_name_extension |
łańcuch | |
day_cyclical_name_extension |
łańcuch | |
hour_cyclical_name_extension |
łańcuch | |
minute_cyclical_name_extension |
łańcuch | |
second_cyclical_name_extension |
łańcuch |