Translation not up to date
Użyj funkcji AutoAI , aby utworzyć eksperyment szeregów czasowych w celu przewidywania przyszłych działań, takich jak ceny akcji lub temperatury, w określonym zakresie daty lub czasu.
Przegląd szeregu czasowego
Eksperyment szeregów czasowych jest metodą prognozowania, która wykorzystuje obserwacje historyczne do przewidywania przyszłych wartości. Eksperyment automatycznie buduje wiele rurociągów z wykorzystaniem modeli uczenia maszynowego, takich jak losowa regresja lasu i wspomagania Vector Machines (SVM), a także statystycznych modeli szeregów czasowych, takich jak ARIMA i Holt-Winters. Następnie eksperyment zaleca najlepszy potok zgodnie z wydajnością rurociągu ocenioną w zestawach danych z holdout lub zestawach danych z opóźnieniem.
W przeciwieństwie do standardowego eksperymentu AutoAI , który buduje zestaw rurociągów do ukończenia, następnie należy do nich szeregować. Eksperyment szeregów czasowych dokonuje oceny rurociągów w procesie, a następnie przeprowadza i testuje najlepiej wykonujące się rurociągi.
Szczegółowe informacje na temat różnych etapów szkolenia i testowania eksperymentu szeregów czasowych można znaleźć w sekcji Szczegóły implementacji szeregów czasowych.
Przewidywanie anomalii w eksperymencie szeregów czasowych
Eksperyment szeregów czasowych można skonfigurować w taki sposób, aby przewidywać anomalie (wartości odstających) w danych lub predykcji. Aby skonfigurować predykcję anomalii dla eksperymentu, należy wykonać kroki opisane w sekcji Tworzenie modelu predykcji anomalii szeregów czasowych.
Korzystanie z funkcji pomocniczych w celu poprawy predykcji
Podczas konfigurowania eksperymentu szeregów czasowych można określić funkcje pomocnicze, zwane również funkcjami egzogennymi. Funkcje pomocnicze to opcje, które wpływają lub dodają kontekst do celu predykcji. Jeśli na przykład prognozuje się sprzedaż lodów, to dzienna temperatura byłaby logiczną funkcją pomocniczą, która sprawiłaby, że prognoza będzie bardziej dokładna.
Leveraging future values for supporting features
Jeśli znasz przyszłe wartości dla funkcji obsługi, możesz wykorzystać te przyszłe wartości podczas wdrażania modelu. Na przykład, jeśli trenujesz model w celu prognozowania przyszłej sprzedaży koszulek, możesz uwzględnić promocyjne rabaty jako składnik wspierający w celu zwiększenia predykcji. Włożenie przyszłej wartości promocji spowoduje, że prognoza będzie bardziej dokładna.
Wymagania dotyczące danych
Są to aktualne wymagania dotyczące danych do szkolenia z serii czasowej eksperymentu:
Dane treningowe muszą być jednym plikiem w formacie CSV.
Plik musi zawierać jedną lub więcej kolumn serii czasowych i opcjonalnie zawierać kolumnę datownika. Listę obsługiwanych formatów daty/godziny można znaleźć w temacie AutoAI time series implementation details(Szczegóły implementacji serii czasowej programu AutoAI).
Jeśli źródło danych zawiera kolumnę datownika, upewnij się, że dane są próbkowane z jednakowej częstotliwości. Oznacza to, że różnica w datownikach sąsiednich wierszy jest taka sama. Na przykład dane mogą być w przyrostach co 1 minuta, 1 godzina lub jeden dzień. Określony znacznik czasu jest używany do określania okna wyszukiwania w celu poprawy dokładności modelu.
Uwaga:Jeśli wielkość pliku jest większa niż 1 GB, należy posortować dane w kolejności malejąco według datownika, a do trenowania eksperymentu używany jest tylko pierwszy 1 GB.
Jeśli źródło danych nie zawiera kolumny datownika, upewnij się, że dane są próbkowane w regularnych odstępach czasu i sortowane w porządku rosnącym zgodnie z przykładową datą/godziną. Oznacza to, że wartość w pierwszym wierszu jest najstarsza, a wartość w ostatnim wierszu jest najnowsza.
Uwaga: Jeśli wielkość pliku jest większa niż 1 GB, należy obciąć ten plik, tak aby był mniejszy niż 1 GB.Wybierz dane, które mają być używane podczas szkolenia ostatnich rurociągów. Jeśli zostanie wybrana opcja uwzględniania tylko danych szkoleniowych, wygenerowane zeszyty będą zawierały komórkę na potrzeby pobierania danych wstrzymanych używanych do oceny poszczególnych rurociągów.
Wybierz dane z projektu lub prześlij je z systemu plików lub z przeglądarki zasobów aplikacyjnych, a następnie kliknij przycisk Kontynuuj. Kliknij ikonę podglądu , po nazwie źródła danych, aby przejrzeć dane. Opcjonalnie można dodać drugi plik jako dane holdout do testowania wyszkolonych rurociągów.
Konfigurowanie eksperymentu szeregów czasowych
Po skonfigurowaniu szczegółów eksperymentu kliknij przycisk Tak , aby Włącz serię czasu , a następnie wypełnij szczegóły eksperymentu.
Pole | Opis |
---|---|
Kolumny predykcji | Kolumny szeregu czasowego, które mają być prognozowane w oparciu o poprzednie wartości. Można określić jedną lub więcej kolumn do przewidzenia. |
Kolumna daty/godziny | Kolumna wskazująca datę/godzinę, o której występują wartości szeregu czasowego. |
Okno wyszukiwania | Parametr, który wskazuje, ile poprzednich wartości szeregu czasowego jest używanych do przewidywania bieżącego punktu czasowego. |
Okno prognozy | Zakres, który ma być prognozowany w oparciu o dane w oknie wyszukiwania. |
Podsumowanie predykcji przedstawia typ eksperymentu i pomiar, który jest wybrany do optymalizacji eksperymentu.
Konfigurowanie ustawień eksperymentu
Aby skonfigurować bardziej szczegółowe informacje na temat eksperymentu serii czasowej, kliknij opcję Ustawienia eksperymentu.
Ogólne ustawienia predykcji
Na panelu Ogólne dla ustawień predykcji można opcjonalnie zmienić wielkość mierzoną używaną do optymalizacji eksperymentu lub określić algorytmy, które mają być rozważane, lub liczbę potoków do wygenerowania.
Pole | Opis |
---|---|
Typ predykcji | Wyświetl lub zmień typ predykcji w oparciu o kolumnę predykcji dla eksperymentu. W przypadku eksperymentów szeregów czasowych domyślnie wybrana jest opcja Prognoza szeregów czasowych . Uwaga: Jeśli zmienisz typ predykcji, inne ustawienia predykcji dla eksperymentu zostaną automatycznie zmienione. |
Zoptymalizowany pomiar | Wyświetl lub zmień zalecaną zoptymalizowaną metrykę dla eksperymentu. |
Wybór zoptymalizowanego algorytmu | Nieobsługiwane w przypadku eksperymentów szeregów czasowych. |
Algorytmy do włączenia | Wybierz algorytmy, na podstawie których chcesz utworzyć pipeliny eksperymentu. Algorytmy i rurociągi, które wspierają korzystanie z funkcji pomocniczych, są oznaczone znacznikiem wyboru. |
Rurociągi do zakończenia | Wyświetl lub zmień liczbę potoków, które mają zostać wygenerowane dla eksperymentu. |
Szczegóły konfiguracji szeregów czasowych
Na panelu szeregów czasowych dla ustawień predykcji skonfiguruj szczegółowe informacje na temat sposobu uczenia eksperymentu i generowania predykcji.
Pole | Opis |
---|---|
Kolumna daty/godziny | Wyświetl lub zmień kolumnę daty/godziny dla eksperymentu. |
Okno wyszukiwania | Wyświetlanie lub aktualizowanie liczby poprzednich wartości szeregu czasowego używanych do przewidywania bieżącego punktu czasowego. |
Okno prognozy | Wyświetl lub zaktualizuj zakres, który chcesz przewidzieć na podstawie danych. |
Konfigurowanie ustawień źródła danych
Aby skonfigurować szczegóły dla danych wejściowych, kliknij opcję Ustawienia eksperymentu i wybierz opcję Źródło danych.
Ogólne ustawienia źródła danych
Na panelu Ogólne dla ustawień źródła danych można zmodyfikować zbiór danych, aby interpolować brakujące wartości, podzielić zestaw danych na szkolenia i dane wstrzymane oraz wprowadzić funkcje pomocnicze.
Pole | Opis |
---|---|
Duplikuj wiersze | Nieobsługiwane w przypadku eksperymentów szeregów czasowych. |
Dane podpróby | Nieobsługiwane w przypadku eksperymentów szeregów czasowych. |
Inżynieria elementów tekstowych | Nieobsługiwane w przypadku eksperymentów szeregów czasowych. |
Ostateczny zestaw danych uczących | Wybierz, jakie dane mają być używane podczas szkolenia końcowych rurociągów: tylko dane treningowe, czy dane treningowe i holdout. Jeśli zostanie wybrana opcja uwzględniania tylko danych uczących, wygenerowane zeszyty dla tego eksperymentu będą zawierały komórkę do pobrania danych wstrzymanych używanych do oceny poszczególnych rurociągów. |
Funkcje spełniające kryteria | Wybierz dodatkowe kolumny z zestawu danych jako funkcje pomocnicze, aby obsługiwać predykcje, a następnie zwiększyć dokładność modelu. Można również użyć wartości przyszłych dla opcji obsługi, włączając opcję Napoje przyszłe wartości opcji pomocniczych. Uwaga: Opcje pomocnicze można używać tylko z wybranymi algorytmami i rurociągami. Więcej informacji na temat algorytmów i rurociągów, które obsługują użycie funkcji pomocniczych, można znaleźć w sekcji Szczegóły implementacji szeregu czasowego. |
Imputacja danych | Użyj imputacji danych, aby zastąpić brakujące wartości w zbiorze danych wartościami podstawianych. Włączenie tej opcji umożliwia określenie, w jaki sposób brakujące wartości powinny być interpolowane w danych. Aby dowiedzieć się więcej na temat imputacji danych, zapoznaj się z imputacją danych w eksperymentach AutoAI . |
Szkolenia i dane holdout | Wybierz, aby zarezerwować niektóre dane z zestawu danych uczących w celu przetestowania eksperymentu. Alternatywnie można przesłać osobny plik danych wstrzymanych. Plik danych holdout musi być zgodny ze schematem danych uczących. |
Konfigurowanie danych szeregów czasowych
Aby skonfigurować dane szeregów czasowych, można dostosować ustawienia dla danych szeregów czasowych, które są powiązane z backtesting (eksperyment). Backtesting udostępnia sposób sprawdzania poprawności modelu szeregów czasowych za pomocą danych historycznych.
W typowym eksperymencie uczenia maszynowego można w sposób losowy wstrzymać część danych, aby przetestować wynikowy model w celu zapewnienia dokładności. Aby sprawdzić poprawność modelu szeregów czasowych, należy zachować relację między danymi szkoleniowym a testowaniem danych.
Metoda backtest zawiera następujące kroki:
- Długość danych uczących jest określana na podstawie liczby wywołań, długości przerw i wielkości wypustów. Więcej informacji na temat tych parametrów znajduje się w sekcji Budowanie eksperymentu z serią czasową.
- Począwszy od najstarszych danych, eksperyment jest przeszkolony z wykorzystaniem danych uczących.
- Eksperyment jest oceniany na podstawie pierwszego zestawu danych sprawdzania poprawności. Jeśli długość luki jest niezerowa, wszystkie dane w przerwie są pomijane.
- Okno danych uczących jest zaawansowane, zwiększając wielkość holdout i dystans, aby utworzyć nowy zestaw treningowy.
- Świeży eksperyment jest przeszkolony w zakresie nowych danych i jest wartościowany przy użyciu kolejnego zestawu danych sprawdzania poprawności.
- Poprzednie dwa kroki są powtarzane dla pozostałych okresów.
Aby dopasować konfigurację backtesting:
- Otwórz okno Ustawienia eksperymentu.
- W obszarze Źródła danychkliknij opcję szeregi czasowe.
- (Opcjonalnie): Dostosuj ustawienia, jak pokazano w tabeli.
Pole | Opis |
---|---|
Liczba boczków | Backtesting jest podobny do walidacji krzyżowej dla okresów data/czas. Opcjonalnie można dostosować liczbę wywołań na potrzeby eksperymentu. |
Walidacyjny | Wielkość zestawu holdout i każdego zestawu sprawdzania poprawności na potrzeby operacji backtesting. Długość walidacji może być regulowana poprzez zmianę długości holdout. |
Długość luki | Liczba punktów czasowych między ustawionym zestawem danych uczących a zestawem danych sprawdzania poprawności dla każdego z nich. Jeśli wartość parametru jest niezerowa, wartości szeregu czasowego w przerwie nie będą używane do uczenia eksperymentu lub do oceny bieżącego. |
Wizualizacja ustawień konfiguracyjnych ilustruje przepływ wsteczny. Grafika jest interaktywna, dzięki czemu można manipulować ustawieniami z grafiki lub z pól konfiguracyjnych. Na przykład, dopasując długość luki, można zobaczyć wyniki sprawdzania poprawności modelu we wcześniejszych okresach danych bez zwiększania liczby wywołań.
Interpretowanie wyników eksperymentu
Po uruchomieniu eksperymentu z serii czasowej można zbadać powstający rurociąg, aby uzyskać informacje na temat szczegółów eksperymentu. Rurociągi, które korzystają z funkcji obsługi, są oznaczone znacznikiem rozszerzenia SUP w celu odróżnienia ich od rurociągów, które nie korzystają z tych funkcji. Aby wyświetlić szczegóły:
- Umieść wskaźnik myszy nad węzłami w wizualizacji, aby uzyskać szczegółowe informacje na temat potoków w miarę ich generowania.
- Przełącz się na widok Mapa postępu, aby zobaczyć inny widok procesu uczenia. W celu uzyskania szczegółowych informacji można umieścić wskaźnik myszy nad każdym węzłem w procesie.
- Po zakończeniu końcowych rurociągów i zapisaniu się na tablicy, można kliknąć rurociąg, aby zobaczyć szczegóły wydajności.
- Kliknij opcję Wyświetl odrzucone rurociągi , aby wyświetlić algorytmy używane dla rurociągów, które nie są wybrane jako górne wykonawca.
- Zapisz kod eksperymentu jako notatnik, który można przejrzeć.
- Zapisz konkretny potok jako notatnik, który można przejrzeć.
Obejrzyj ten film wideo, aby zobaczyć, jak uruchomić eksperyment szeregów czasowych i stworzyć model w notatniku Jupyter przy użyciu szkoleń i danych holdout.
Ten film wideo udostępnia metodę wizualną, która umożliwia poznanie pojęć i zadań w tej dokumentacji.
Następne kroki
- Wykonaj kurs krok po kroku, aby szkolić model szeregów czasowych univariate w celu przewidywania minimalnych temperatur przy użyciu danych przykładowych.
- Aby potrenować eksperyment szeregów czasowych z funkcjami pomocnicznymi, należy przejść do kursu krok po kroku.
- Sekcja zawiera informacje na temat oceniania wdrożonego modelu szeregów czasowych.
- Sekcja zawiera informacje na temat używania interfejsu API dla eksperymentów serii czasowych AutoAI.
Zasoby dodatkowe
- Wprowadzenie do prognozowania z eksperymentami szeregów czasowych AutoAI można znaleźć w blogu Right on time(series): Introducing Watson Studio’s AutoAI Time Series.
- Więcej informacji na temat tworzenia eksperymentu dotyczącego szeregów czasowych można znaleźć w tym blogu o tworzeniu nowego eksperymentu serii czasowej.
- Przeczytaj wpis w blogu dotyczący dodawania funkcji pomocniczych do eksperymentu szeregów czasowych.
- Zapoznaj się z przykładowym notatnikiem , aby przeprowadzić eksperyment z serii czasowych z funkcjami pomocniczą.
- Przeczytaj wpis w blogu dotyczący dodawania funkcji pomocniczych do eksperymentu z serią czasową przy użyciu interfejsu API.
Następne kroki
- Kurs: Eksperyment szeregów czasowych programu AutoAI
- Kurs: AutoAI obsługując eksperyment szeregów czasowych
- Szczegóły implementacji eksperymentu szeregów czasowych
- Ocenianie modelu szeregów czasowych
Temat nadrzędny: PrzeglądAutoAI