Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
Uzel Auto Data Prep (ADP) může analyzovat vaše data a identifikovat opravy, odstranit pole, která jsou problematická nebo nemusí být užitečná, odvozovat nové atributy v případě potřeby a zlepšit výkonnost pomocí inteligentního screeningu a technik výběru vzorků. Uzel můžete použít plně automatizovaným způsobem, což umožňuje uzlu zvolit a použít opravy, nebo můžete zobrazit náhled změn před jejich provedením a přijetím, odmítnutím nebo jejich změnou, jak potřebujete.
Příklad
node = stream.create("autodataprep", "My node")
node.setPropertyValue("objective", "Balanced")
node.setPropertyValue("excluded_fields", "Filter")
node.setPropertyValue("prepare_dates_and_times", True)
node.setPropertyValue("compute_time_until_date", True)
node.setPropertyValue("reference_date", "Today")
node.setPropertyValue("units_for_date_durations", "Automatic")
autodataprepnode vlastnosti |
Datový typ | Popis vlastnosti |
---|---|---|
objective |
Balanced Speed Accuracy Custom |
|
custom_fields |
příznak | Pokud je hodnota nastavena na true, můžete pro aktuální uzel určit cíl, vstup a další pole. Má-li hodnotu false, použijí se aktuální nastavení z uzlu předchozího typu. |
target |
pole | Určuje jedno cílové pole. |
inputs |
[field1 ... fieldN] | Vstupní nebo predikční pole použitá modelem. |
use_frequency |
příznak | |
frequency_field |
pole | |
use_weight |
příznak | |
weight_field |
pole | |
excluded_fields |
Filter None |
|
if_fields_do_not_match |
StopExecution ClearAnalysis |
|
prepare_dates_and_times |
příznak | Řízení přístupu ke všem polím data a času |
compute_time_until_date |
příznak | |
reference_date |
Today Fixed |
|
fixed_date |
datum | |
units_for_date_durations |
Automatic Fixed |
|
fixed_date_units |
Years Months Days |
|
compute_time_until_time |
příznak | |
reference_time |
CurrentTime Fixed |
|
fixed_time |
čas | |
units_for_time_durations |
Automatic Fixed |
|
fixed_time_units |
Hours Minutes Seconds |
|
extract_year_from_date |
příznak | |
extract_month_from_date |
příznak | |
extract_day_from_date |
příznak | |
extract_hour_from_time |
příznak | |
extract_minute_from_time |
příznak | |
extract_second_from_time |
příznak | |
exclude_low_quality_inputs |
příznak | |
exclude_too_many_missing |
příznak | |
maximum_percentage_missing |
Číslo | |
exclude_too_many_categories |
příznak | |
maximum_number_categories |
Číslo | |
exclude_if_large_category |
příznak | |
maximum_percentage_category |
Číslo | |
prepare_inputs_and_target |
příznak | |
adjust_type_inputs |
příznak | |
adjust_type_target |
příznak | |
reorder_nominal_inputs |
příznak | |
reorder_nominal_target |
příznak | |
replace_outliers_inputs |
příznak | |
replace_outliers_target |
příznak | |
replace_missing_continuous_inputs |
příznak | |
replace_missing_continuous_target |
příznak | |
replace_missing_nominal_inputs |
příznak | |
replace_missing_nominal_target |
příznak | |
replace_missing_ordinal_inputs |
příznak | |
replace_missing_ordinal_target |
příznak | |
maximum_values_for_ordinal |
Číslo | |
minimum_values_for_continuous |
Číslo | |
outlier_cutoff_value |
Číslo | |
outlier_method |
Replace Delete |
|
rescale_continuous_inputs |
příznak | |
rescaling_method |
MinMax ZScore |
|
min_max_minimum |
Číslo | |
min_max_maximum |
Číslo | |
z_score_final_mean |
Číslo | |
z_score_final_sd |
Číslo | |
rescale_continuous_target |
příznak | |
target_final_mean |
Číslo | |
target_final_sd |
Číslo | |
transform_select_input_fields |
příznak | |
maximize_association_with_target |
příznak | |
p_value_for_merging |
Číslo | |
merge_ordinal_features |
příznak | |
merge_nominal_features |
příznak | |
minimum_cases_in_category |
Číslo | |
bin_continuous_fields |
příznak | |
p_value_for_binning |
Číslo | |
perform_feature_selection |
příznak | |
p_value_for_selection |
Číslo | |
perform_feature_construction |
příznak | |
transformed_target_name_extension |
řetězec | |
transformed_inputs_name_extension |
řetězec | |
constructed_features_root_name |
řetězec | |
years_duration_ name_extension |
řetězec | |
months_duration_ name_extension |
řetězec | |
days_duration_ name_extension |
řetězec | |
hours_duration_ name_extension |
řetězec | |
minutes_duration_ name_extension |
řetězec | |
seconds_duration_ name_extension |
řetězec | |
year_cyclical_name_extension |
řetězec | |
month_cyclical_name_extension |
řetězec | |
day_cyclical_name_extension |
řetězec | |
hour_cyclical_name_extension |
řetězec | |
minute_cyclical_name_extension |
řetězec | |
second_cyclical_name_extension |
řetězec |