Verwenden Sie diesen Knoten, um ein temporales kausales Modell (Temporal Causal Model, TCM) zu erstellen.
Temporale kausale Modellierung versucht, die wichtigsten kausalen Beziehungen in Zeitreihendaten aufzuspüren. Bei temporaler kausaler Modellierung geben Sie ein Set von Zielzeitreihen und ein Set von Kandidateneingaben in diese Ziele an. Daraufhin erstellt die Prozedur ein autoregressives Zeitreihenmodell für jedes der Ziele und schließt nur solche Eingaben ein, die eine kausale Beziehung zum Ziel haben. Dieser Ansatz unterscheidet sich von der konventionellen Zeitreihenmodellierung, bei der Sie die Prädiktoren für eine Zielzeitreihe explizit angeben müssen. Da die zeitliche Kausalmodellierung typischerweise die Erstellung von Modellen für mehrere zusammengehörige Zeitreihen umfasst, wird das Ergebnis als Modellsystem bezeichnet.
Im Kontext der temporalen kausalen Modellierung wird mit dem Begriff kausal die Granger-Kausalität bezeichnet. Eine Zeitreihe X wird als "Granger-Ursache" einer anderen Zeitreihe Y bezeichnet, wenn die Regression für Y im Hinblick auf vergangene Wert von X und von Y zu einem besseren Modell für Y führt als allein die Regression auf vergangene Werte von Y.
Beispiele
Entscheidungsträger verwenden temporale kausale Modellierung, um kausale Beziehungen in einer großen Gruppe zeitbasierter Metriken zu entdecken, die das Geschäft beschreiben. Möglicherweise deckt die Analyse einige wenige steuerbare Eingaben auf, die den größten Einfluss auf wesentliche Leistungsindikatoren haben.
Manager großer IT-System können temporale kausale Modellierung verwenden, um Anomalien in einer großen Gruppe von Betriebsmesswerten, die in Wechselbeziehung zueinander stehen, zu erkennen. Das kausale Modell erlaubt dann, über die Anomalieerkennung hinaus die wahrscheinlichsten Fehlerursachen der Anomalien zu ermitteln.
Feldanforderungen
Es muss mindestens ein Ziel geben. Standardmäßig werden Felder mit der vordefinierten Rolle None
nicht verwendet.
Datenstruktur
Die temporale kausale Modellierung unterstützt zwei Datenstrukturtypen:
- Spaltenbasierte Daten
- Bei spaltenbasierten Daten enthält jedes Zeitreihenfeld die Daten für eine einzelne Zeitreihe. Dies ist die traditionelle Struktur für Zeitreihendaten, wie sie von der Zeitreihenmodellierung verwendet wird.
- Mehrdimensionale Daten
- Bei mehrdimensionalen Daten enthält jedes Zeitreihenfeld die Daten für mehrere Zeitreihen. Innerhalb eines bestimmten Felds werden separate Zeitreihen dann durch ein Set von Werten für kategoriale Felder ermittelt, die als Dimensionsfelder bezeichnet werden. Beispiel: Verkaufsdaten für zwei verschiedene Vertriebskanäle (Einzelhandel und Web) können in einem einzigen
sales
-Feld gespeichert werden. Ein Dimensionsfeld namenschannel
mit den Wertenretail
undweb
gibt die Datensätze an, die jedem der beiden Vertriebskanäle zugeordnet sind.
m>(L + KL + 1)
Dabei ist m
die Anzahl der Datenpunkte, L
ist die Anzahl der Lags und K
ist die Anzahl der Prädiktoren. Stellen Sie sicher, dass Ihr Dataset groß genug ist, damit die Anzahl der Datenpunkte (m
) die Bedingung erfüllt.