Translation not up to date
Węzeł Sekwencje wykrywa wzorce w sekwencyjnych lub zorientowanych czasowo danych, w następującej postaci bread -> cheese
. Elementy w kolejności to zbiory elementów, które tworzą pojedynczą transakcję.
Na przykład, jeśli dana osoba idzie do sklepu i kupuje chleb i mleko, a następnie po kilku dniach wraca do sklepu i kupuje ser, aktywność zakupową tej osoby mogą reprezentować dwa zbiory elementów. Pierwszy zbiór elementów zawiera chleb i mleko, a drugi zawiera ser. Sekwencja to lista zbiorów elementów z tendencją do występowania w przewidywalnej kolejności. Węzeł Sekwencje wykrywa powtarzające się sekwencje i tworzy wygenerowany węzeł modelu, którego można użyć do predykcji.
Wymagania. W celu utworzenia zestawu reguł Sekwencje konieczne jest określenie zmiennej identyfikacyjnej, opcjonalnej zmiennej czasowej i jednej lub więcej zmiennych zawartości. Należy zwrócić uwagę, że te ustawienia należy wprowadzić na karcie Zmienne węzła modelowania; nie można ich odczytać z poprzedzającego węzła Typ. Zmienną identyfikacyjną może charakteryzować dowolna rola i dowolny poziom pomiaru. W przypadku określenia zmiennej czasu może mieć ona dowolną rolę, lecz jej składowaniem musi być wartość numeryczna, data, godzina lub znacznik czasu. W przypadku nieokreślenia zmiennej czasu węzeł Sekwencje będzie używał implikowanego znacznika czasowego, co oznacza używanie numerów wierszy jako wartości czasu. Zmienne zawartości mogą mieć dowolny poziom pomiaru i rolę, lecz wszystkie zmienne treści muszą być tego samego typu. Jeśli są one numeryczne, muszą być przedziałami całkowitoliczbowymi (nie przedziałami liczb rzeczywistych).
Mocne strony. Węzeł Sekwencje bazuje na algorytmie reguł asocjacyjnych CARMA, który korzysta z efektywnej metody dwu przejść do znajdowania sekwencji. Ponadto generowany węzeł modelu tworzony przez węzeł Sekwencje może zostać wstawiony do strumienia danych, co pozwoli na utworzenie predykcji. Generowany węzeł modelu umożliwia także generowanie superwęzłów umożliwiających wykrywanie i zliczanie określonych sekwencji oraz tworzenie predykcji w oparciu o określone sekwencje.