영어 버전 문서로 돌아가기시계열 실험에 대한 데이터 대체 구현 세부사항
시계열 실험에 대한 데이터 대체 구현 세부사항
마지막 업데이트 날짜: 2024년 10월 04일
시계열 실험에서 데이터 대체에 사용되는 실험 설정입니다.
데이터 대체 방법
실험 설정에서 이러한 데이터 대체 방법 중 하나를 적용하여 데이터 세트에 결측값을 제공하십시오.
대치 메소드 | 설명 |
---|---|
FlattenIterative | 시계열 데이터가 먼저 평탄화된 다음 결측값이 Scikit-learn 반복 대치기로 대치됩니다. |
선형 | 선형 보간법은 결측값을 대치하는 데 사용됩니다. |
3차(U) | 3차 보간법은 결측값을 대치하는 데 사용됩니다. |
이전 | 누락된 값은 이전 값으로 대체됩니다. |
다음 | 누락된 값은 다음 값으로 대체됩니다. |
채우기 | 결측값은 사용자 지정 값, 표본 평균 또는 표본 중위수를 사용하여 대치됩니다. |
입력 설정
이 명령은 노트북에서 시계열 실험에 대한 데이터 대체를 지원하는 데 사용됩니다.
이름 | 설명 | 값 | DefaultValue |
---|---|---|---|
use_imputation | 대체를 켜거나 끄는 플래그입니다. | True 또는 False | 예 |
imputer_list | 검색할 대체자 이름(문자열)의 목록입니다. 목록을 지정하지 않으면 모든 기본 대체자가 검색됩니다. 빈 목록이 전달되면 모든 대체자가 검색됩니다. | "FlattenIterative", "Linear", "Cubic", "Previous", "Fill", "Next" | "FlattenIterative", "Linear", "Cubic", "Previous" |
imputer_fill_type | "Fill" 대체자의 카테고리 | "mean"/"median"/"value" | "value" |
imputer_fill_value | 모든 결측값에 대해 채워지는 단일 숫자 값입니다. "imputer_fill_type"이 "value"로 지정된 경우에만 적용됩니다. "mean" 또는 "median"이 "imputer_fill_type"에 지정된 경우 무시됩니다. | (음의 무한대, 양의 무한대) | 0 |
imputation_threshold | 대체에 대한 임계값. 결측값 비율은 한 열의 임계값보다 커서는 안됩니다. 그렇지 않으면 오류가 발생합니다. | (0, 1) | 0.25 |
use_imputation 사용법에 대한 참고사항
use_imputation
메소드가True
로 지정되고 입력 데이터에 누락된 값이 있는 경우:imputation_threshold
이(가) 적용됩니다.imputer_list
의 대체자 후보는 가장 적합한 대체자를 검색하는 데 사용됩니다.- 최상의 대체자가
Fill
인 경우imputer_fill_type
및imputer_fill_value
가 적용됩니다. 그렇지 않으면 무시됩니다.
use_imputation
메소드가True
로 지정되고 입력 데이터에 누락된 값이 없는 경우:imputation_threshold
은(는) 무시됩니다.imputer_list
의 대치 후보는 최상의 대치 후보를 검색하는 데 사용됩니다. 최상의 대체자가Fill
인 경우imputer_fill_type
및imputer_fill_value
가 적용됩니다. 그렇지 않으면 무시됩니다.
use_imputation
메소드가False
로 지정되었지만 입력 데이터에 누락된 값이 있는 경우:use_imputation
가 경고와 함께 켜지면 메소드는 첫 번째 시나리오의 동작을 따릅니다.
use_imputation
메소드가False
로 지정되고 입력 데이터에 누락된 값이 없는 경우 추가 처리가 필요하지 않습니다.
예를 들어,
"pipelines": [
{
"id": "automl",
"runtime_ref": "hybrid",
"nodes": [
{
"id": "automl-ts",
"type": "execution_node",
"op": "kube",
"runtime_ref": "automl",
"parameters": {
"del_on_close": true,
"optimization": {
"target_columns": [2,3,4],
"timestamp_column": 1,
"use_imputation": true
}
}
}
]
}
]
상위 주제: AutoAI 실험의 데이터 대체