이 노드를 사용하여 시간 인과 모델(TCM)을 작성합니다.
시간 인과 모델링은 시계열 데이터에서 핵심 인과 관계를 검색하려고 시도합니다. 시간 인과 모델링에서 목표 계열 세트 및 해당 목표에 대한 후보 입력 세트를 지정합니다. 프로시저는 목표마다 자기회귀 시계열 모델을 작성하고 목표와 인과 관계를 갖는 입력만 포함합니다. 이 접근 방법은 목표 계열에 대해 명시적으로 예측자를 지정해야 하는 전형적인 시계열 모델링과 다릅니다. 시간 인과 모델링에는 일반적으로 여러 관련 시계열에 대한 모델 작성이 포함되므로 결과를 모델 시스템이라고 합니다.
시간 인과 모델링의 컨텍스트에서, 인과 용어는 그랜저 인과성을 가리킵니다. X 및 Y 둘 다의 지난 값 관점에서 Y에 대한 회귀추정이 Y의 지난 값에 대해서만 회귀추정하는 것보다 Y에 대해 더 나은 모델이 생성되는 경우 시계열 X는 다른 시계열 Y의 "그렌저 인과" 관계라고 합니다.
예
비즈니스 의사결정자는 비즈니스를 설명하는 시간 기반 메트릭의 큰 세트 내에서 인과 관계를 알아내기 위해 시간 인과 모델링을 사용할 수 있습니다. 분석은 몇 개의 제어 가능한 입력을 드러낼 수 있습니다. 이 입력은 핵심성과지표(KPI)에 대한 가장 큰 영향을 가지고 있습니다.
대규모 IT 시스템의 관리자는 시간 인과 모델링을 사용하여 상호 관련된 작동 메트릭의 큰 세트에서 이상 항목을 발견할 수 있습니다. 인과 모델은 이상 항목 발견을 넘어서 이상 항목의 가장 근본적인 원인을 발견할 수 있도록 합니다.
필드 요구 사항
최소 하나의 목표가 있어야 합니다. 기본적으로 사전 정의된 역할이 None
인 필드는 사용되지 않습니다.
데이터 구조
시간 인과 모델링은 다음 두 가지 유형의 데이터 구조를 지원합니다.
- 열 기반 데이터
- 열 기반 데이터의 경우, 각 시계열 필드에는 단일 시계열에 대한 데이터가 포함됩니다. 이 구조는 시계열 Modeler에서 사용되는 전형적인 시계열 데이터 구조입니다.
- 다차원 데이터
- 다차원 데이터의 경우 각 시계열 필드에는 여러 시계열에 대한 데이터가 포함됩니다. 특정 필드에서 별도의 시계열이 차원 필드라는 범주형 필드의 값 세트로 식별됩니다. 예를 들어, 두 개의 다른 판매 채널(소매 및 웹)에 대한 판매 데이터가 단일
sales
필드에 저장될 수 있습니다. 값이retail
및web
인channel
차원 필드는 두 판매 채널 각각과 연관된 레코드를 식별합니다.
m>(L + KL + 1)
여기서, m
은 데이터 점의 수이며 L
은 시차의 수이며 K
는 예측자 수입니다. 데이터 점의 수(m
)가 조건을 충족할 수 있도록 데이터 세트가 충분한지 확인하십시오.