영어 버전 문서로 돌아가기autodataprepnode 특성
autodataprepnode 특성
마지막 업데이트 날짜: 2024년 10월 07일
ADP (Auto Data Preprep) 노드는 데이터를 분석하고 수정사항을 식별하며, 문제가 있거나 유용할 가능성이 없는 필드를 선별하고, 적절한 경우 새 속성을 파생하고, 지능형 선별 및 표본추출 기술을 통해 성능을 개선할 수 있습니다. 완전 자동화된 방식으로 노드를 사용하여 노드가 수정사항을 선택하고 적용할 수 있게 하거나, 변경사항이 작성 및 승인되기 전에 변경을 미리보거나, 거부 또는 원하는 대로 개정할 수 있습니다.
예
node = stream.create("autodataprep", "My node")
node.setPropertyValue("objective", "Balanced")
node.setPropertyValue("excluded_fields", "Filter")
node.setPropertyValue("prepare_dates_and_times", True)
node.setPropertyValue("compute_time_until_date", True)
node.setPropertyValue("reference_date", "Today")
node.setPropertyValue("units_for_date_durations", "Automatic")
autodataprepnode 특성 |
데이터 유형 | 특성 설명 |
---|---|---|
objective |
Balanced Speed Accuracy Custom |
|
custom_fields |
플래그 | True인 경우 현재 노드에 대한 목표, 입력 및 기타 필드를 지정할 수 있습니다. False인 경우 업스트림 유형 노드의 현재 설정을 사용합니다. |
target |
필드 | 단일 대상 필드를 지정합니다. |
inputs |
[field1 ... fieldN] | 모델에서 사용하는 입력 또는 예측자 필드입니다. |
use_frequency |
플래그 | |
frequency_field |
필드 | |
use_weight |
플래그 | |
weight_field |
필드 | |
excluded_fields |
Filter None |
|
if_fields_do_not_match |
StopExecution ClearAnalysis |
|
prepare_dates_and_times |
플래그 | 모든 날짜 및 시간 필드에 대한 액세스를 제어합니다. |
compute_time_until_date |
플래그 | |
reference_date |
Today Fixed |
|
fixed_date |
날짜 | |
units_for_date_durations |
Automatic Fixed |
|
fixed_date_units |
Years Months Days |
|
compute_time_until_time |
플래그 | |
reference_time |
CurrentTime Fixed |
|
fixed_time |
시간 | |
units_for_time_durations |
Automatic Fixed |
|
fixed_time_units |
Hours Minutes Seconds |
|
extract_year_from_date |
플래그 | |
extract_month_from_date |
플래그 | |
extract_day_from_date |
플래그 | |
extract_hour_from_time |
플래그 | |
extract_minute_from_time |
플래그 | |
extract_second_from_time |
플래그 | |
exclude_low_quality_inputs |
플래그 | |
exclude_too_many_missing |
플래그 | |
maximum_percentage_missing |
Number | |
exclude_too_many_categories |
플래그 | |
maximum_number_categories |
Number | |
exclude_if_large_category |
플래그 | |
maximum_percentage_category |
Number | |
prepare_inputs_and_target |
플래그 | |
adjust_type_inputs |
플래그 | |
adjust_type_target |
플래그 | |
reorder_nominal_inputs |
플래그 | |
reorder_nominal_target |
플래그 | |
replace_outliers_inputs |
플래그 | |
replace_outliers_target |
플래그 | |
replace_missing_continuous_inputs |
플래그 | |
replace_missing_continuous_target |
플래그 | |
replace_missing_nominal_inputs |
플래그 | |
replace_missing_nominal_target |
플래그 | |
replace_missing_ordinal_inputs |
플래그 | |
replace_missing_ordinal_target |
플래그 | |
maximum_values_for_ordinal |
Number | |
minimum_values_for_continuous |
Number | |
outlier_cutoff_value |
Number | |
outlier_method |
Replace Delete |
|
rescale_continuous_inputs |
플래그 | |
rescaling_method |
MinMax ZScore |
|
min_max_minimum |
Number | |
min_max_maximum |
Number | |
z_score_final_mean |
Number | |
z_score_final_sd |
Number | |
rescale_continuous_target |
플래그 | |
target_final_mean |
Number | |
target_final_sd |
Number | |
transform_select_input_fields |
플래그 | |
maximize_association_with_target |
플래그 | |
p_value_for_merging |
Number | |
merge_ordinal_features |
플래그 | |
merge_nominal_features |
플래그 | |
minimum_cases_in_category |
Number | |
bin_continuous_fields |
플래그 | |
p_value_for_binning |
Number | |
perform_feature_selection |
플래그 | |
p_value_for_selection |
Number | |
perform_feature_construction |
플래그 | |
transformed_target_name_extension |
문자열 | |
transformed_inputs_name_extension |
문자열 | |
constructed_features_root_name |
문자열 | |
years_duration_ name_extension |
문자열 | |
months_duration_ name_extension |
문자열 | |
days_duration_ name_extension |
문자열 | |
hours_duration_ name_extension |
문자열 | |
minutes_duration_ name_extension |
문자열 | |
seconds_duration_ name_extension |
문자열 | |
year_cyclical_name_extension |
문자열 | |
month_cyclical_name_extension |
문자열 | |
day_cyclical_name_extension |
문자열 | |
hour_cyclical_name_extension |
문자열 | |
minute_cyclical_name_extension |
문자열 | |
second_cyclical_name_extension |
문자열 |