0 / 0
Go back to the English version of the documentation
vlastnosti autodataprepnode
Last updated: 12. 1. 2023
vlastnosti autodataprepnode

Ikona uzlu automatického předp. datUzel Auto Data Prep (ADP) může analyzovat vaše data a identifikovat opravy, odstranit pole, která jsou problematická nebo nemusí být užitečná, odvozovat nové atributy v případě potřeby a zlepšit výkonnost pomocí inteligentního screeningu a technik výběru vzorků. Uzel můžete použít plně automatizovaným způsobem, což umožňuje uzlu zvolit a použít opravy, nebo můžete zobrazit náhled změn před jejich provedením a přijetím, odmítnutím nebo jejich změnou, jak potřebujete.

Příklad

node = stream.create("autodataprep", "My node")
node.setPropertyValue("objective", "Balanced")
node.setPropertyValue("excluded_fields", "Filter")
node.setPropertyValue("prepare_dates_and_times", True)
node.setPropertyValue("compute_time_until_date", True)
node.setPropertyValue("reference_date", "Today")
node.setPropertyValue("units_for_date_durations", "Automatic")
Tabulka 1. vlastnosti autodataprepnode
autodataprepnode vlastnosti Datový typ Popis vlastnosti
objective Balanced
Speed
Accuracy
Custom
 
custom_fields Příznak Pokud je hodnota nastavena na true, můžete pro aktuální uzel určit cíl, vstup a další pole. Má-li hodnotu false, použijí se aktuální nastavení z uzlu předchozího typu.
target pole Určuje jedno cílové pole.
inputs [field1 ... fieldN] Vstupní nebo predikční pole použitá modelem.
use_frequency Příznak  
frequency_field pole  
use_weight Příznak  
weight_field pole  
excluded_fields Filter
None
 
if_fields_do_not_match StopExecution
ClearAnalysis
 
prepare_dates_and_times Příznak Řízení přístupu ke všem polím data a času
compute_time_until_date Příznak  
reference_date Today
Fixed
 
fixed_date datum  
units_for_date_durations Automatic
Fixed
 
fixed_date_units Years
Months
Days
 
compute_time_until_time Příznak  
reference_time CurrentTime
Fixed
 
fixed_time čas  
units_for_time_durations Automatic
Fixed
 
fixed_time_units Hours
Minutes
Seconds
 
extract_year_from_date Příznak  
extract_month_from_date Příznak  
extract_day_from_date Příznak  
extract_hour_from_time Příznak  
extract_minute_from_time Příznak  
extract_second_from_time Příznak  
exclude_low_quality_inputs Příznak  
exclude_too_many_missing Příznak  
maximum_percentage_missing Číslo  
exclude_too_many_categories Příznak  
maximum_number_categories Číslo  
exclude_if_large_category Příznak  
maximum_percentage_category Číslo  
prepare_inputs_and_target Příznak  
adjust_type_inputs Příznak  
adjust_type_target Příznak  
reorder_nominal_inputs Příznak  
reorder_nominal_target Příznak  
replace_outliers_inputs Příznak  
replace_outliers_target Příznak  
replace_missing_continuous_inputs Příznak  
replace_missing_continuous_target Příznak  
replace_missing_nominal_inputs Příznak  
replace_missing_nominal_target Příznak  
replace_missing_ordinal_inputs Příznak  
replace_missing_ordinal_target Příznak  
maximum_values_for_ordinal Číslo  
minimum_values_for_continuous Číslo  
outlier_cutoff_value Číslo  
outlier_method Replace
Delete
 
rescale_continuous_inputs Příznak  
rescaling_method MinMax
ZScore
 
min_max_minimum Číslo  
min_max_maximum Číslo  
z_score_final_mean Číslo  
z_score_final_sd Číslo  
rescale_continuous_target Příznak  
target_final_mean Číslo  
target_final_sd Číslo  
transform_select_input_fields Příznak  
maximize_association_with_target Příznak  
p_value_for_merging Číslo  
merge_ordinal_features Příznak  
merge_nominal_features Příznak  
minimum_cases_in_category Číslo  
bin_continuous_fields Příznak  
p_value_for_binning Číslo  
perform_feature_selection Příznak  
p_value_for_selection Číslo  
perform_feature_construction Příznak  
transformed_target_name_extension řetězec  
transformed_inputs_name_extension řetězec  
constructed_features_root_name řetězec  
years_duration_ name_extension řetězec  
months_duration_ name_extension řetězec  
days_duration_ name_extension řetězec  
hours_duration_ name_extension řetězec  
minutes_duration_ name_extension řetězec  
seconds_duration_ name_extension řetězec  
year_cyclical_name_extension řetězec  
month_cyclical_name_extension řetězec  
day_cyclical_name_extension řetězec  
hour_cyclical_name_extension řetězec  
minute_cyclical_name_extension řetězec  
second_cyclical_name_extension řetězec