0 / 0
Go back to the English version of the documentation
węzeł TCM
Last updated: 12 sty 2023
Węzeł TCM (SPSS Modeler)

Ten węzeł umożliwia tworzenie modelu przyczynowego szeregów czasowych (TCM).

Modelowanie przyczynowe szeregów czasowych jest próbą wykrycia kluczowych zależności przyczynowych w danych o szeregach czasowych. W procesie takiego modelowania użytkownik określa zbiór szeregów przewidywanych i zbiór potencjalnych zmiennych wejściowych dla tych szeregów przewidywanych. Następnie procedura buduje autoregresyjny model każdego szeregu przewidywanego i uwzględnia tylko te zmienne wejściowe, które z przewidywanym szeregiem łączą relacje przyczynowe. Ta strategia różni się od tradycyjnego modelowania szeregów czasowych, w którym użytkownik musi jawnie określić predyktory dla przewidywanego szeregu. Ponieważ w modelowaniu przyczynowym szeregów czasowych zazwyczaj buduje się modele dla wielu powiązanych szeregów czasowych, wynik tego modelowania nazywamy systemem modelu.

W kontekście modelowania przyczynowego szeregów czasowych termin przyczynowe odnosi się do przyczynowości w sensie Grangera. Szereg czasowy X jest uznawany za „przyczynę w sensie Grangera” innego szeregu czasowego Y, jeśli regresja dla Y przy przeszłych wartościach szeregów X i Y zwraca lepszy model dla Y niż regresja tylko przy przeszłych wartościach dla Y.

Przykłady

Osoby podejmujące decyzje biznesowe mogą korzystać z modelowania przyczynowego szeregów czasowych do odkrywania relacji przyczynowych w dużych zestawach metryk w oparciu o czas opisujących procesy biznesowe. Efektem analizy może być zidentyfikowanie możliwych do zmiany danych wejściowych mających największy wpływ na kluczowe wskaźniki wydajności.

Menedżerowie dużych systemów IT mogą korzystać z modelowania przyczynowego szeregów czasowych do wykrywania anomalii w dużych zbiorach powiązanych ze sobą metryk operacyjnych. Model przyczynowy umożliwia wówczas więcej niż tylko wykrywanie anomalii i odkrywanie najbardziej prawdopodobnych ich przyczyn.

Wymagania dotyczące zmiennych

Wymagana jest co najmniej jedna zmienna przewidywana. Domyślnie pola z predefiniowaną rolą None nie są używane.

Struktura danych

Modelowanie przyczynowe szeregów czasowych obsługuje dwa typy struktur danych:

Dane kolumnowe
W przypadku danych kolumnowych każda zmienna szeregu czasowego zawiera dane dla jednego szeregu czasowego. Struktura ta jest tradycyjną strukturą danych szeregów czasowych, stosowaną przez kreator modeli szeregów czasowych.
Dane wielowymiarowe
W przypadku danych wielowymiarowych, każda zmienna szeregów czasowych zawiera dane dla wielu szeregów czasowych. Oddzielne szeregi czasowe w ramach danej zmiennej są wówczas identyfikowane na podstawie zestawu wartości zmiennych jakościowych, zwanych także zmiennymi wymiarów. Na przykład dane dotyczące sprzedaży dla dwóch różnych kanałów sprzedaży (handlu detalicznego i sieci WWW) mogą być przechowywane w jednym polu sales . Pole wymiaru o nazwie channelz wartościami retail i webidentyfikuje rekordy, które są powiązane z każdym z dwóch kanałów sprzedaży.
Uwaga: Aby zbudować model przyczynowy szeregów czasowych, potrzebne są wystarczające punkty danych. W programie obowiązuje ograniczenie:
m>(L + KL + 1)
gdzie m jest liczbą punktów danych, L jest liczbą opóźnień, a K jest liczbą predyktorów. Dane muszą być na tyle obszerne, by liczba punktów danych (m) spełniała ten warunek.