Torna alla versione inglese della documentazioneproprietà autodataprepnode
proprietà autodataprepnode
Ultimo aggiornamento: 07 ott 2024
Il nodo ADP (Auto Data Prep) può analizzare i dati e identificare le correzioni, escludere i campi problematici o che non possono essere utili, derivare nuovi attributi quando appropriato e migliorare le prestazioni tramite tecniche di screening e campionamento intelligenti. Il nodo si può utilizzare in modo completamente automatico, permettendogli di scegliere e di applicare le correzioni, oppure visualizzando in anteprima le modifiche prima dell'applicazione e accettandole, respingendole o modificandole a seconda dei casi.
Esempio
node = stream.create("autodataprep", "My node")
node.setPropertyValue("objective", "Balanced")
node.setPropertyValue("excluded_fields", "Filter")
node.setPropertyValue("prepare_dates_and_times", True)
node.setPropertyValue("compute_time_until_date", True)
node.setPropertyValue("reference_date", "Today")
node.setPropertyValue("units_for_date_durations", "Automatic")
Proprietà autodataprepnode |
Tipo di dati | Descrizione proprietà |
---|---|---|
objective |
Balanced Speed Accuracy Custom |
|
custom_fields |
indicatore | Se vera, consente di specificare i campi obiettivo, di input e di altro tipo per il nodo corrente. Se falsa, vengono utilizzate le impostazioni correnti di un nodo Tipo a monte. |
target |
campo | Specifica un singolo campo obiettivo. |
inputs |
[field1 ... fieldN] | I campi di input o predittore utilizzati dal modello. |
use_frequency |
indicatore | |
frequency_field |
campo | |
use_weight |
indicatore | |
weight_field |
campo | |
excluded_fields |
Filter None |
|
if_fields_do_not_match |
StopExecution ClearAnalysis |
|
prepare_dates_and_times |
indicatore | Controllo dell'accesso a tutti i campi data e ora |
compute_time_until_date |
indicatore | |
reference_date |
Today Fixed |
|
fixed_date |
Data | |
units_for_date_durations |
Automatic Fixed |
|
fixed_date_units |
Years Months Days |
|
compute_time_until_time |
indicatore | |
reference_time |
CurrentTime Fixed |
|
fixed_time |
ora | |
units_for_time_durations |
Automatic Fixed |
|
fixed_time_units |
Hours Minutes Seconds |
|
extract_year_from_date |
indicatore | |
extract_month_from_date |
indicatore | |
extract_day_from_date |
indicatore | |
extract_hour_from_time |
indicatore | |
extract_minute_from_time |
indicatore | |
extract_second_from_time |
indicatore | |
exclude_low_quality_inputs |
indicatore | |
exclude_too_many_missing |
indicatore | |
maximum_percentage_missing |
numero | |
exclude_too_many_categories |
indicatore | |
maximum_number_categories |
numero | |
exclude_if_large_category |
indicatore | |
maximum_percentage_category |
numero | |
prepare_inputs_and_target |
indicatore | |
adjust_type_inputs |
indicatore | |
adjust_type_target |
indicatore | |
reorder_nominal_inputs |
indicatore | |
reorder_nominal_target |
indicatore | |
replace_outliers_inputs |
indicatore | |
replace_outliers_target |
indicatore | |
replace_missing_continuous_inputs |
indicatore | |
replace_missing_continuous_target |
indicatore | |
replace_missing_nominal_inputs |
indicatore | |
replace_missing_nominal_target |
indicatore | |
replace_missing_ordinal_inputs |
indicatore | |
replace_missing_ordinal_target |
indicatore | |
maximum_values_for_ordinal |
numero | |
minimum_values_for_continuous |
numero | |
outlier_cutoff_value |
numero | |
outlier_method |
Replace Delete |
|
rescale_continuous_inputs |
indicatore | |
rescaling_method |
MinMax ZScore |
|
min_max_minimum |
numero | |
min_max_maximum |
numero | |
z_score_final_mean |
numero | |
z_score_final_sd |
numero | |
rescale_continuous_target |
indicatore | |
target_final_mean |
numero | |
target_final_sd |
numero | |
transform_select_input_fields |
indicatore | |
maximize_association_with_target |
indicatore | |
p_value_for_merging |
numero | |
merge_ordinal_features |
indicatore | |
merge_nominal_features |
indicatore | |
minimum_cases_in_category |
numero | |
bin_continuous_fields |
indicatore | |
p_value_for_binning |
numero | |
perform_feature_selection |
indicatore | |
p_value_for_selection |
numero | |
perform_feature_construction |
indicatore | |
transformed_target_name_extension |
Stringa | |
transformed_inputs_name_extension |
Stringa | |
constructed_features_root_name |
Stringa | |
years_duration_ name_extension |
Stringa | |
months_duration_ name_extension |
Stringa | |
days_duration_ name_extension |
Stringa | |
hours_duration_ name_extension |
Stringa | |
minutes_duration_ name_extension |
Stringa | |
seconds_duration_ name_extension |
Stringa | |
year_cyclical_name_extension |
Stringa | |
month_cyclical_name_extension |
Stringa | |
day_cyclical_name_extension |
Stringa | |
hour_cyclical_name_extension |
Stringa | |
minute_cyclical_name_extension |
Stringa | |
second_cyclical_name_extension |
Stringa |