Translation not up to date
Ten węzeł umożliwia tworzenie modelu przyczynowego szeregów czasowych (TCM).
Modelowanie przyczynowe szeregów czasowych jest próbą wykrycia kluczowych zależności przyczynowych w danych o szeregach czasowych. W procesie takiego modelowania użytkownik określa zbiór szeregów przewidywanych i zbiór potencjalnych zmiennych wejściowych dla tych szeregów przewidywanych. Następnie procedura buduje autoregresyjny model każdego szeregu przewidywanego i uwzględnia tylko te zmienne wejściowe, które z przewidywanym szeregiem łączą relacje przyczynowe. Ta strategia różni się od tradycyjnego modelowania szeregów czasowych, w którym użytkownik musi jawnie określić predyktory dla przewidywanego szeregu. Ponieważ w modelowaniu przyczynowym szeregów czasowych zazwyczaj buduje się modele dla wielu powiązanych szeregów czasowych, wynik tego modelowania nazywamy systemem modelu.
W kontekście modelowania przyczynowego szeregów czasowych termin przyczynowe odnosi się do przyczynowości w sensie Grangera. Szereg czasowy X jest uznawany za „przyczynę w sensie Grangera” innego szeregu czasowego Y, jeśli regresja dla Y przy przeszłych wartościach szeregów X i Y zwraca lepszy model dla Y niż regresja tylko przy przeszłych wartościach dla Y.
Przykłady
Osoby podejmujące decyzje biznesowe mogą korzystać z modelowania przyczynowego szeregów czasowych do odkrywania relacji przyczynowych w dużych zestawach metryk w oparciu o czas opisujących procesy biznesowe. Efektem analizy może być zidentyfikowanie możliwych do zmiany danych wejściowych mających największy wpływ na kluczowe wskaźniki wydajności.
Menedżerowie dużych systemów IT mogą korzystać z modelowania przyczynowego szeregów czasowych do wykrywania anomalii w dużych zbiorach powiązanych ze sobą metryk operacyjnych. Model przyczynowy umożliwia wówczas więcej niż tylko wykrywanie anomalii i odkrywanie najbardziej prawdopodobnych ich przyczyn.
Wymagania dotyczące zmiennych
Wymagana jest co najmniej jedna zmienna przewidywana. Domyślnie pola z predefiniowaną rolą None
nie są używane.
Struktura danych
Modelowanie przyczynowe szeregów czasowych obsługuje dwa typy struktur danych:
- Dane kolumnowe
- W przypadku danych kolumnowych każda zmienna szeregu czasowego zawiera dane dla jednego szeregu czasowego. Struktura ta jest tradycyjną strukturą danych szeregów czasowych, stosowaną przez kreator modeli szeregów czasowych.
- Dane wielowymiarowe
- W przypadku danych wielowymiarowych, każda zmienna szeregów czasowych zawiera dane dla wielu szeregów czasowych. Oddzielne szeregi czasowe w ramach danej zmiennej są wówczas identyfikowane na podstawie zestawu wartości zmiennych jakościowych, zwanych także zmiennymi wymiarów. Na przykład dane dotyczące sprzedaży dla dwóch różnych kanałów sprzedaży (handlu detalicznego i sieci WWW) mogą być przechowywane w jednym polu
sales
. Pole wymiaru o nazwiechannel
z wartościamiretail
iweb
identyfikuje rekordy, które są powiązane z każdym z dwóch kanałów sprzedaży.
m>(L + KL + 1)
gdzie m
jest liczbą punktów danych, L
jest liczbą opóźnień, a K
jest liczbą predyktorów. Dane muszą być na tyle obszerne, by liczba punktów danych
(m
) spełniała ten warunek.