Volver a la versión inglesa de la documentaciónproperties de autodataprepnode
properties de autodataprepnode
Última actualización: 07 oct 2024
El nodo Preparación automática de datos (ADP) puede analizar los datos e identificar los arreglos, eliminar los campos que son problemáticos o que probablemente no sean útiles, derivar nuevos atributos cuando sea apropiado y mejorar el rendimiento mediante técnicas inteligentes de exploración y muestreo. Puede utilizar el nodo de forma totalmente automática, permitiendo que el nodo seleccione y aplique valores fijos, o bien puede tener una vista previa de los cambios antes de que se apliquen y aceptarlos o rechazarlos.
Ejemplo
node = stream.create("autodataprep", "My node")
node.setPropertyValue("objective", "Balanced")
node.setPropertyValue("excluded_fields", "Filter")
node.setPropertyValue("prepare_dates_and_times", True)
node.setPropertyValue("compute_time_until_date", True)
node.setPropertyValue("reference_date", "Today")
node.setPropertyValue("units_for_date_durations", "Automatic")
Propiedades de autodataprepnode |
Tipo de datos | Descripción de la propiedad |
---|---|---|
objective |
Balanced Speed Accuracy Custom |
|
custom_fields |
distintivo | Si es verdadero, le permite especificar el objetivo, la entrada y otros campos del nodo actual. Si es falso, se utiliza la configuración actual de un nodo Tipo situado en un punto anterior de la ruta. |
target |
campo | Especifica un campo de objetivo único. |
inputs |
[field1 ... fieldN] | Campos de entrada o predictor utilizados por el modelo. |
use_frequency |
distintivo | |
frequency_field |
campo | |
use_weight |
distintivo | |
weight_field |
campo | |
excluded_fields |
Filter None |
|
if_fields_do_not_match |
StopExecution ClearAnalysis |
|
prepare_dates_and_times |
distintivo | Controla el acceso a todos los campos de fecha y hora |
compute_time_until_date |
distintivo | |
reference_date |
Today Fixed |
|
fixed_date |
Fecha | |
units_for_date_durations |
Automatic Fixed |
|
fixed_date_units |
Years Months Days |
|
compute_time_until_time |
distintivo | |
reference_time |
CurrentTime Fixed |
|
fixed_time |
Hora | |
units_for_time_durations |
Automatic Fixed |
|
fixed_time_units |
Hours Minutes Seconds |
|
extract_year_from_date |
distintivo | |
extract_month_from_date |
distintivo | |
extract_day_from_date |
distintivo | |
extract_hour_from_time |
distintivo | |
extract_minute_from_time |
distintivo | |
extract_second_from_time |
distintivo | |
exclude_low_quality_inputs |
distintivo | |
exclude_too_many_missing |
distintivo | |
maximum_percentage_missing |
número | |
exclude_too_many_categories |
distintivo | |
maximum_number_categories |
número | |
exclude_if_large_category |
distintivo | |
maximum_percentage_category |
número | |
prepare_inputs_and_target |
distintivo | |
adjust_type_inputs |
distintivo | |
adjust_type_target |
distintivo | |
reorder_nominal_inputs |
distintivo | |
reorder_nominal_target |
distintivo | |
replace_outliers_inputs |
distintivo | |
replace_outliers_target |
distintivo | |
replace_missing_continuous_inputs |
distintivo | |
replace_missing_continuous_target |
distintivo | |
replace_missing_nominal_inputs |
distintivo | |
replace_missing_nominal_target |
distintivo | |
replace_missing_ordinal_inputs |
distintivo | |
replace_missing_ordinal_target |
distintivo | |
maximum_values_for_ordinal |
número | |
minimum_values_for_continuous |
número | |
outlier_cutoff_value |
número | |
outlier_method |
Replace Delete |
|
rescale_continuous_inputs |
distintivo | |
rescaling_method |
MinMax ZScore |
|
min_max_minimum |
número | |
min_max_maximum |
número | |
z_score_final_mean |
número | |
z_score_final_sd |
número | |
rescale_continuous_target |
distintivo | |
target_final_mean |
número | |
target_final_sd |
número | |
transform_select_input_fields |
distintivo | |
maximize_association_with_target |
distintivo | |
p_value_for_merging |
número | |
merge_ordinal_features |
distintivo | |
merge_nominal_features |
distintivo | |
minimum_cases_in_category |
número | |
bin_continuous_fields |
distintivo | |
p_value_for_binning |
número | |
perform_feature_selection |
distintivo | |
p_value_for_selection |
número | |
perform_feature_construction |
distintivo | |
transformed_target_name_extension |
serie | |
transformed_inputs_name_extension |
serie | |
constructed_features_root_name |
serie | |
years_duration_ name_extension |
serie | |
months_duration_ name_extension |
serie | |
days_duration_ name_extension |
serie | |
hours_duration_ name_extension |
serie | |
minutes_duration_ name_extension |
serie | |
seconds_duration_ name_extension |
serie | |
year_cyclical_name_extension |
serie | |
month_cyclical_name_extension |
serie | |
day_cyclical_name_extension |
serie | |
hour_cyclical_name_extension |
serie | |
minute_cyclical_name_extension |
serie | |
second_cyclical_name_extension |
serie |