Utilisez ce noeud pour créer un modèle de causalité temporelle (TCM).
La modélisation de causalité temporelle tente de découvrir des relations de causalité clés dans les données de séries temporelles. Dans la modélisation de causalité temporelle, vous spécifiez un ensemble de séries cibles et un ensemble d'entrées candidates sur ces cibles. La procédure construit alors un modèle de série temporelle autorégressive pour chaque cible et n'inclut que les entrées avec une relation de causalité avec la cible. Cette approche diffère de la modélisation traditionnelle de série temporelle où vous devez spécifier explicitement les prédicteurs pour une série cible. Étant donné que la modélisation causale temporelle implique généralement la création de modèles pour plusieurs séries temporelles associées, le résultat est appelé système modèle.
Dans le contexte de modélisation de causalité temporelle, le terme causal se réfère à la causalité au sens de Granger. Un série temporelle X est dite "causer au sens de Granger" une autre série temporelle Y si la régression de Y en prenant en compte les valeurs passées de X et de Y produit un meilleur modèle pour Y que la seule régression des valeurs passées de Y.
Exemples
Les décideurs métier peuvent utiliser la modélisation de causalité temporelle pour identifier des relations de causalité dans un vaste ensemble de métriques basées temps qui décrivent l'activité. L'analyse peut révéler un petit nombre d'entrées contrôlables qui ont l'impact le plus déterminant sur les indicateurs de performances clés.
Les responsables de systèmes informatiques à grande échelle peuvent utiliser la modélisation de causalité temporelle pour détecter des anomalies dans un large éventail de métriques opérationnelles interdépendantes. Le modèle causal peut alors ne pas se contenter de détecter des anomalies, mais découvrir aussi leurs causes premières les plus probables.
Exigences concernant les champs
Au moins une cible doit avoir été définie. Par défaut, les champs avec le rôle prédéfini None
ne sont pas utilisés.
Structure des données
La modélisation de causalité temporelle prend en charge deux types de structures de données :
- Données basées colonne
- Pour les données basées colonne, chaque zone de série temporelle contient les données d'une seule série temporelle. Il s'agit de la structure traditionnelle des données de série temporelle, telle qu'utilisée par Time Series Modeler.
- Données multidimensionnelles
- Pour les données multidimensionnelles, chaque champ de série temporelle contient les données de plusieurs séries temporelles. Des séries temporelles distinctes au sein d'un champ donné sont ensuite identifiées par un ensemble de valeurs de champs catégoriels appelés champs de dimension. Par exemple, les données de vente de deux canaux de vente différents (commerce de détail et Web) peuvent être stockées dans un seul champ
sales
. Un champ de dimension nomméchannel
, avec les valeursretail
etweb
, identifie les enregistrements associés à chacun des deux canaux de vente.
m>(L + KL + 1)
où m
correspond au nombre de points de données,
L
au nombre de décalages et K
au nombre de prédicteurs. Prenez soin que votre ensemble de données soit suffisamment volumineux afin que le nombre de points de données (m
) respecte cette condition.