このノードは、時間的因果モデル (TCM) を作成する場合に使用します。
時間的因果モデリングでは、時系列データの重要な因果関係の発見が試みられます。 時間的因果モデリングでは、一連の対象系列を指定し、それらの対象系列に対する一連の入力候補を指定します。 そうすると、プロシージャにより、各対象の自己回帰時系列モデルが作成され、対象に対して因果関係を持つ入力のみが含まれます。 このアプローチは、対象系列の予測値を明示的に指定する必要がある従来型の時系列モデリングとは異なります。 時間的因果モデリングでは通常、複数の関連する時系列のモデルを作成することが関係するため、結果は モデル・システムと呼ばれます。
時間的因果モデリングのコンテキストでは、因果 という用語は、グレンジャー因果関係を指します。 X および Y の両方の過去の値の観点で Y について回帰した方が、Y の過去の値のみを回帰するよりもより良い Y のモデルが作成される場合、時系列 X は、「グレンジャー原因」の別の時系列 Y に伝えられます。
例
ビジネスの意思決定者は、時間的因果モデリングを使用して、ビジネスを説明する一連の大規模な時間ベースのメトリック内の因果関係を発見できます。 この分析により、重要業績評価指標に重大な影響を及ぼすいくつかの制御可能な入力が明らかになることがあります。
巨大な IT システムのマネージャーは、時間的因果モデリングを使用して、相互に関連する一連の大規模な操作メトリックの異常値を検査できます。 したがって、因果モデルでは、異常値を検査するだけではなく、最も可能性の高い異常値の根本原因を発見できます。
フィールドの要件
少なくとも 1 つの対象が必要です。 デフォルトでは、 None
という事前定義の役割を持つフィールドは使用されません。
データ構造
時間的因果モデリングでは、以下に示す 2 種類のデータ構造がサポートされています。
- 列ベースのデータ
- 列ベースのデータの場合、各時系列フィールドには、単一の時系列のデータが含まれます。 この構造は、時系列モデラーで使用される、従来型の時系列データの構造です。
- 多次元データ
- 多次元データの場合、各時系列フィールドには、複数の時系列のデータが含まれます。 特定のフィールド内の個々の時系列は、dimension フィールドと呼ばれるカテゴリー型フィールドの一連の値によって識別されます。 例えば、2 つの異なる販売チャネル (小売および Web) の販売データが単一の
sales
フィールドに格納されることがあります。 値retail
およびweb
を持つchannel
という次元フィールドは、2 つの販売チャネルのそれぞれに関連付けられたレコードを識別します。
m>(L + KL + 1)
ここで、m
はデータ・ポイント数、L
はラグ数、K
は予測値の数を表します。 データ・ポイント数 (m
) が条件を満たすように、データ・セットのサイズが十分に大きいことを確認してください。