Translation not up to date
Utwórz eksperyment predykcji anomalii szeregów czasowych w celu przeszkolenia modelu, który może wykryć anomalie lub nieoczekiwane wyniki, gdy model przewiduje wyniki na podstawie nowych danych.
Podgląd techniczny To jest podgląd technologii, który nie jest jeszcze obsługiwany w środowiskach produkcyjnych.
Wykrywanie anomalii w predykatach
Istnieje możliwość użycia predykcji anomalii w celu znalezienia wartości odstających w predykatach modelowych. Należy rozważyć następujące scenariusze szkolenia modelu szeregów czasowych z przewidywaniem anomalii. Załóżmy na przykład, że istnieją metryki operacyjne z urządzeń monitorujących, które zostały zebrane w zakresie dat od 2022.1.1 do 2022.3.31. Użytkownik ma pewność, że w danych dla tego okresu nie istnieją żadne anomalie, nawet jeśli dane nie są oznaczone etykietami. Eksperyment predykcji anomalii szeregów czasowych można wykorzystać do:
- Modele rurociągi kandydujące do modelu pociągu i automatycznie wybierają kandydat na model najwyżej sklasyfikowany
- Wdróż wybrany model, aby przewidzieć nowe obserwacje, jeśli:
- Nowy punkt czasowy jest anomalią (na przykład wynik w trybie z połączeniem przewiduje punkt czasowy 2022.4.1 , który znajduje się poza oczekiwanym zakresem)
- Nowy zakres czasu ma anomalie (na przykład, wynik zadania wsadowego przewiduje wartości od 2022.4.1 do 2022.4.7, poza oczekiwanym zakresem)
Praca z próbką
Aby utworzyć eksperyment z szeregami czasowymi AutoAI z przewidywaniem anomalii, który korzysta z przykładu:
Utwórz eksperyment AutoAI .
Wybierz opcję Przykład galerii.
Kliknij kafelek w polu Przykładowe dane dotyczące anomalii wykorzystania energii elektrycznej.
Postępuj zgodnie z instrukcjami, aby skonfigurować i uruchomić eksperyment.
Przejrzyj szczegółowe informacje na temat rurociągów i zapoznaj się z wizualizacjami.
Konfigurowanie eksperymentu szeregów czasowych z przewidywaniem anomalii
Załaduj dane do eksperymentu.
Ograniczenie: Do eksperymentu predykcji anomalii można przesłać tylko jeden plik danych. Jeśli przesyłany jest drugi plik danych (dla danych holdout), opcja predykcji Anomaly jest wyłączona i dostępna jest tylko opcja Prognoza. Eksperymenty predykcji Anomaly używają domyślnie podzbioru danych uczących do sprawdzania poprawności.Kliknij przycisk Tak , aby wybrać opcję Włącz serię czasu.
Jako typ eksperymentu wybierz opcję Anomaly predykcja .
Skonfiguruj kolumny opcji ze źródła danych, które chcesz przewidzieć na podstawie poprzednich wartości. Można określić jedną lub więcej kolumn do przewidzenia.
Wybierz kolumnę daty/godziny.
Podsumowanie predykcji przedstawia typ eksperymentu i pomiar, który jest wybrany do optymalizacji eksperymentu.
Konfigurowanie ustawień eksperymentu
Aby skonfigurować bardziej szczegółowe informacje na temat eksperymentu z serią czasową, otwórz panel Ustawienia eksperymentu . Opcje, które nie są dostępne dla eksperymentów predykcji anomalii, są niedostępne.
Ogólne ustawienia predykcji
Na panelu Ogólne dla ustawień predykcji skonfiguruj szczegóły na potrzeby szkolenia eksperymentu.
Pole | Opis |
---|---|
Typ predykcji | Wyświetl lub zmień typ predykcji w oparciu o kolumnę predykcji dla eksperymentu. W przypadku eksperymentów serii czasowych domyślnie wybrana jest opcja predykcja anomalii szeregów czasowych . Uwaga: Jeśli zmienisz typ predykcji, inne ustawienia predykcji dla eksperymentu zostaną automatycznie zmienione. |
Zoptymalizowany pomiar | Wybierz metrykę, aby zoptymalizować i ranking rurociągów. |
Wybór zoptymalizowanego algorytmu | Nieobsługiwane w przypadku eksperymentów szeregów czasowych. |
Algorytmy do włączenia | Wybierz algorytmy oparte na tym, które eksperymenty mają tworzyć potokami. Algorytmy obsługują predykcję anomalii. |
Rurociągi do zakończenia | Wyświetl lub zmień liczbę potoków, które mają zostać wygenerowane dla eksperymentu. |
Szczegóły konfiguracji szeregów czasowych
Na panelu szeregów czasowych dla ustawień predykcji skonfiguruj szczegółowe informacje na temat sposobu uczenia eksperymentu i generowania predykcji.
Pole | Opis |
---|---|
Kolumna daty/godziny | Wyświetl lub zmień kolumnę daty/godziny dla eksperymentu. |
Okno wyszukiwania | Nieobsługiwane w przypadku predykcji anomalii. |
Okno prognozy | Nieobsługiwane w przypadku predykcji anomalii. |
Konfigurowanie ustawień źródła danych
Aby skonfigurować szczegóły dla danych wejściowych, otwórz panel Ustawienia eksperymentu i wybierz opcję Źródło danych.
Ogólne ustawienia źródła danych
Na panelu Ogólne dla ustawień źródła danych można wybrać opcje, w których można wykorzystać dane eksperymentu.
Pole | Opis |
---|---|
Duplikuj wiersze | Nieobsługiwane w przypadku eksperymentów dotyczących predykcji anomalii szeregów czasowych. |
Dane podpróby | Nieobsługiwane w przypadku eksperymentów dotyczących predykcji anomalii szeregów czasowych. |
Inżynieria elementów tekstowych | Nieobsługiwane w przypadku eksperymentów dotyczących predykcji anomalii szeregów czasowych. |
Ostateczny zestaw danych uczących | Predykcja anomalii korzysta z pojedynczego pliku źródła danych, który jest ostatnim zestawem danych uczących. |
Funkcje spełniające kryteria | Nieobsługiwane w przypadku eksperymentów dotyczących predykcji anomalii szeregów czasowych. |
Imputacja danych | Nieobsługiwane w przypadku eksperymentów dotyczących predykcji anomalii szeregów czasowych. |
Szkolenia i dane holdout | Predykcja anomalii nie obsługuje osobnego pliku holdout. Użytkownik może dostosować sposób podziału danych między szkoleniami i danymi holdout. Uwaga: W niektórych przypadkach funkcja AutoAI może nadpisać ustawienia wydrążone, aby upewnić się, że podział jest poprawny dla eksperymentu. W tym przypadku zostanie wyświetlone powiadomienie, a zmiana zostanie odnotowane w pliku dziennika. |
Przeglądanie wyników eksperymentu
Po uruchomieniu eksperymentu wskaźnik postępu wyświetla ścieżki do tworzenia potoku. W rankingu znajdują się pipeliny na tablicy. Wynik potoku określa, jak dobrze wykonany jest potok dla wielkości mierzonej optymalizującego.
Na karcie Podsumowanie eksperymentu wyświetlana jest wizualizacja sposobu wykonania pomiarów dla potoku.
- Użyj filtru pomiaru, aby skupić się na konkretnych metrykach.
- Umieść wskaźnik myszy nad nazwą pomiaru, aby wyświetlić szczegóły.
Kliknij nazwę potoku, aby wyświetlić szczegóły. Na stronie Ocena modelu można przejrzeć tabelę podsumowującą szczegółowe informacje na temat potoku.
- Wiersze reprezentują pięć metryk oceny: Obszar pod ROC, Precision, Recall, F1, Średnia precyzja.
- Kolumny reprezentują cztery zsyntetyzowane typy anomalii: przesunięcie poziomu, trend, zlokalizowana skrajność, wariacja.
- Każda wartość w komórce jest średnią wielkości mierzonej w oparciu o trzy iteracje wartościowania w typie anomalii syntetyzowanej.
Pomiary ewaluacji:
Te wielkości mierzone są używane do oceny potoku:
Metryka | Opis |
---|---|
Wynik agregatu (zalecane) | Ten wynik jest obliczany na podstawie agregacji wartości zoptymalizowanej wielkości mierzonej (na przykład średniej dokładności) dla 4 typów anomalii. Wyniki dla każdego potoku są uporządkowane, przy użyciu metody liczenia Borda, a następnie ważone dla ich udziału w wyniku zagregowanego. W przeciwieństwie do standardowego wyniku pomiaru, ta wartość nie mieści się w zakresie od 0 do 1. Wyższa wartość oznacza większy wynik. |
ROC AUC | Miara tego, jak dobrze parametr może rozróżniać dwie grupy. |
F1 | Harmoniczna średnia precyzja i przypomnienie, o najlepszej wartości 1 (doskonała precyzja i przypomnienie) i najgorsze o 0. |
Precyzja | Mierzy dokładność predykcji w oparciu o procent poprawnych predykcji, które są poprawne. |
Czułość | Mierzy procent zidentyfikowanych pozytywnych predykcji na podstawie możliwych pozycji w zestawie danych. |
Typy anomalii
Są to wykryte anomalie typu AutoAI .
Typ anomalii | Opis |
---|---|
Zlokalizowana ekstremalna anomalia | Nietypowy punkt danych w szeregu czasowym, który znacznie odbiega od punktów danych wokół niego. |
Anomalia zmiany poziomu | Segment, w którym zmieniana jest średnia wartość szeregu czasowego. |
Anomalia trendu | Segment szeregów czasowych, który ma zmianę trendu w porównaniu z szeregiem czasowym przed segmentem. |
Anomalia wariancji | Segment szeregów czasowych, w którym wariancja szeregu czasowego ulega zmianie. |
Zapisywanie potoku jako modelu
Aby zapisać model jako model uczenia maszynowego jako model uczenia maszynowego, wybierz opcję Zapisz jako model dla preferowanego potoku. Model zostanie zapisany jako zasób projektu. Model można awansować do obszaru i utworzyć dla niego wdrożenie.
Zapisywanie potoku jako notatnika
Aby przejrzeć kod dla potoku, wybierz opcję Zapisz jako notatnik dla potoku. Automatycznie wygenerowany notatnik jest zapisywany jako zasób projektu. Przejrzyj kod, aby zbadać, jak potok został wygenerowany.
Szczegółowe informacje na temat metod używanych w kodzie potoku można znaleźć w dokumentacji biblioteki autoai-ts-libs.
Ocenianie modelu
Po zapisaniu potoku jako modelu, a następnie awansowaniu modelu do obszaru, można ocenić model, aby wygenerować predykcje dla danych wejściowych lub ładunku danych. Ocenianie modelu i interpretowanie wyników jest podobne do oceniania binarnego modelu klasyfikacji, ponieważ wynik przedstawia jedną z dwóch możliwych wartości dla każdej predykcji:
- 1 = nie wykryto anomalii
- -1 = wykryto anomalię
Szczegóły wdrożenia
Należy zwrócić uwagę na te wymagania dotyczące wdrażania modelu predykcji anomalii.
- Schemat dla danych wejściowych z debetem musi być zgodny ze schematem dla danych uczących z wyjątkiem predykcji lub kolumny docelowej.
- Kolejność pól dla oceny modelu musi być taka sama, jak kolejność pól w schemacie danych uczących.
Przykład wdrożenia
Poniżej znajduje się poprawne dane wejściowe dla modelu predykcji anomalii:
{
"input_data": [
{
"id": "observations",
"values": [
[12,34],
[22,23],
[35,45],
[46,34]
]
}
]
}
Wynik dla tego wejścia to [1,1,-1,1]
, gdzie -1
oznacza, że wartość jest anomalią, a 1
oznacza, że predykcja znajduje się w normalnym zakresie.
Szczegóły implementacji
Algorytmy te obsługują predykcje anomalii w eksperymentach szeregów czasowych.
Algorytm | Typ | Transformer |
---|---|---|
Nazwa potoku | Typ algorytmu | Transformer |
PointwiseBoundedHoltWintersDodatek | Prognozowanie | Nd. |
PointwiseBoundedBATS | Prognozowanie | Nd. |
PointwiseBoundedBATSForceUpdate | Prognozowanie | Nd. |
WindowNN | Okno | Płaski |
WindowPCA | Relacje | Płaski |
WindowLOF | Okno | Płaski |
Algorytmy są zorganizowane w tych kategoriach:
- Prognozowanie: Algorytmy wykrywania anomalii za pomocą metod prognozowania szeregów czasowych
- Relacja: Algorytmy wykrywające anomalie poprzez analizę relacji między punktami danych
- Okno: Algorytmy wykrywające anomalie poprzez zastosowanie transformacji i technik ML do walcowania okien
Więcej inform.
Zapisywanie wygenerowanego notatnika AutoAI (Watson Machine Learning)
Temat nadrzędny: Budowanie eksperymentu szeregów czasowych