0 / 0
Go back to the English version of the documentation
Budowanie eksperymentu szeregów czasowych
Last updated: 18 sie 2023
Budowanie eksperymentu szeregów czasowych

Użyj funkcji AutoAI , aby utworzyć eksperyment szeregów czasowych w celu przewidywania przyszłych działań, takich jak ceny akcji lub temperatury, w określonym zakresie daty lub czasu.

Przegląd szeregu czasowego

Eksperyment szeregów czasowych jest metodą prognozowania, która wykorzystuje obserwacje historyczne do przewidywania przyszłych wartości. Eksperyment automatycznie buduje wiele rurociągów z wykorzystaniem modeli uczenia maszynowego, takich jak losowa regresja lasu i wspomagania Vector Machines (SVM), a także statystycznych modeli szeregów czasowych, takich jak ARIMA i Holt-Winters. Następnie eksperyment zaleca najlepszy potok zgodnie z wydajnością rurociągu ocenioną w zestawach danych z holdout lub zestawach danych z opóźnieniem.

W przeciwieństwie do standardowego eksperymentu AutoAI , który buduje zestaw rurociągów do ukończenia, następnie należy do nich szeregować. Eksperyment szeregów czasowych dokonuje oceny rurociągów w procesie, a następnie przeprowadza i testuje najlepiej wykonujące się rurociągi.

Proces generowania potoku szeregów czasowych AutoAI

Szczegółowe informacje na temat różnych etapów szkolenia i testowania eksperymentu szeregów czasowych można znaleźć w sekcji Szczegóły implementacji szeregów czasowych.

Przewidywanie anomalii w eksperymencie szeregów czasowych

Eksperyment szeregów czasowych można skonfigurować w taki sposób, aby przewidywać anomalie (wartości odstających) w danych lub predykcji. Aby skonfigurować predykcję anomalii dla eksperymentu, należy wykonać kroki opisane w sekcji Tworzenie modelu predykcji anomalii szeregów czasowych.

Korzystanie z funkcji pomocniczych w celu poprawy predykcji

Podczas konfigurowania eksperymentu szeregów czasowych można określić funkcje pomocnicze, zwane również funkcjami egzogennymi. Funkcje pomocnicze to opcje, które wpływają lub dodają kontekst do celu predykcji. Jeśli na przykład prognozuje się sprzedaż lodów, to dzienna temperatura byłaby logiczną funkcją pomocniczą, która sprawiłaby, że prognoza będzie bardziej dokładna.

Leveraging future values for supporting features

Jeśli znasz przyszłe wartości dla funkcji obsługi, możesz wykorzystać te przyszłe wartości podczas wdrażania modelu. Na przykład, jeśli trenujesz model w celu prognozowania przyszłej sprzedaży koszulek, możesz uwzględnić promocyjne rabaty jako składnik wspierający w celu zwiększenia predykcji. Włożenie przyszłej wartości promocji spowoduje, że prognoza będzie bardziej dokładna.

Wymagania dotyczące danych

Są to aktualne wymagania dotyczące danych do szkolenia z serii czasowej eksperymentu:

  • Dane treningowe muszą być jednym plikiem w formacie CSV.

  • Plik musi zawierać jedną lub więcej kolumn serii czasowych i opcjonalnie zawierać kolumnę datownika. Listę obsługiwanych formatów daty/godziny można znaleźć w temacie AutoAI time series implementation details(Szczegóły implementacji serii czasowej programu AutoAI).

  • Jeśli źródło danych zawiera kolumnę datownika, upewnij się, że dane są próbkowane z jednakowej częstotliwości. Oznacza to, że różnica w datownikach sąsiednich wierszy jest taka sama. Na przykład dane mogą być w przyrostach co 1 minuta, 1 godzina lub jeden dzień. Określony znacznik czasu jest używany do określania okna wyszukiwania w celu poprawy dokładności modelu.

    Uwaga:

    Jeśli wielkość pliku jest większa niż 1 GB, należy posortować dane w kolejności malejąco według datownika, a do trenowania eksperymentu używany jest tylko pierwszy 1 GB.

  • Jeśli źródło danych nie zawiera kolumny datownika, upewnij się, że dane są próbkowane w regularnych odstępach czasu i sortowane w porządku rosnącym zgodnie z przykładową datą/godziną. Oznacza to, że wartość w pierwszym wierszu jest najstarsza, a wartość w ostatnim wierszu jest najnowsza.

    Uwaga: Jeśli wielkość pliku jest większa niż 1 GB, należy obciąć ten plik, tak aby był mniejszy niż 1 GB.
  • Wybierz dane, które mają być używane podczas szkolenia ostatnich rurociągów. Jeśli zostanie wybrana opcja uwzględniania tylko danych szkoleniowych, wygenerowane zeszyty będą zawierały komórkę na potrzeby pobierania danych wstrzymanych używanych do oceny poszczególnych rurociągów.

Wybierz dane z projektu lub prześlij je z systemu plików lub z przeglądarki zasobów aplikacyjnych, a następnie kliknij przycisk Kontynuuj. Kliknij ikonę podglądu Ikona zestawu danych podglądu AutoAI, po nazwie źródła danych, aby przejrzeć dane. Opcjonalnie można dodać drugi plik jako dane holdout do testowania wyszkolonych rurociągów.

Konfigurowanie eksperymentu szeregów czasowych

Po skonfigurowaniu szczegółów eksperymentu kliknij przycisk Tak , aby Włącz serię czasu , a następnie wypełnij szczegóły eksperymentu.

Pole Opis
Kolumny predykcji Kolumny szeregu czasowego, które mają być prognozowane w oparciu o poprzednie wartości. Można określić jedną lub więcej kolumn do przewidzenia.
Kolumna daty/godziny Kolumna wskazująca datę/godzinę, o której występują wartości szeregu czasowego.
Okno wyszukiwania Parametr, który wskazuje, ile poprzednich wartości szeregu czasowego jest używanych do przewidywania bieżącego punktu czasowego.
Okno prognozy Zakres, który ma być prognozowany w oparciu o dane w oknie wyszukiwania.

Podsumowanie predykcji przedstawia typ eksperymentu i pomiar, który jest wybrany do optymalizacji eksperymentu.

Konfigurowanie ustawień eksperymentu

Aby skonfigurować bardziej szczegółowe informacje na temat eksperymentu serii czasowej, kliknij opcję Ustawienia eksperymentu.

Ogólne ustawienia predykcji

Na panelu Ogólne dla ustawień predykcji można opcjonalnie zmienić wielkość mierzoną używaną do optymalizacji eksperymentu lub określić algorytmy, które mają być rozważane, lub liczbę potoków do wygenerowania.

Pole Opis
Typ predykcji Wyświetl lub zmień typ predykcji w oparciu o kolumnę predykcji dla eksperymentu. W przypadku eksperymentów szeregów czasowych domyślnie wybrana jest opcja Prognoza szeregów czasowych .
Uwaga: Jeśli zmienisz typ predykcji, inne ustawienia predykcji dla eksperymentu zostaną automatycznie zmienione.
Zoptymalizowany pomiar Wyświetl lub zmień zalecaną zoptymalizowaną metrykę dla eksperymentu.
Wybór zoptymalizowanego algorytmu Nieobsługiwane w przypadku eksperymentów szeregów czasowych.
Algorytmy do włączenia Wybierz algorytmy, na podstawie których chcesz utworzyć pipeliny eksperymentu. Algorytmy i rurociągi, które wspierają korzystanie z funkcji pomocniczych, są oznaczone znacznikiem wyboru.
Rurociągi do zakończenia Wyświetl lub zmień liczbę potoków, które mają zostać wygenerowane dla eksperymentu.

Szczegóły konfiguracji szeregów czasowych

Na panelu szeregów czasowych dla ustawień predykcji skonfiguruj szczegółowe informacje na temat sposobu uczenia eksperymentu i generowania predykcji.

Pole Opis
Kolumna daty/godziny Wyświetl lub zmień kolumnę daty/godziny dla eksperymentu.
Okno wyszukiwania Wyświetlanie lub aktualizowanie liczby poprzednich wartości szeregu czasowego używanych do przewidywania bieżącego punktu czasowego.
Okno prognozy Wyświetl lub zaktualizuj zakres, który chcesz przewidzieć na podstawie danych.

Konfigurowanie ustawień źródła danych

Aby skonfigurować szczegóły dla danych wejściowych, kliknij opcję Ustawienia eksperymentu i wybierz opcję Źródło danych.

Ogólne ustawienia źródła danych

Na panelu Ogólne dla ustawień źródła danych można zmodyfikować zbiór danych, aby interpolować brakujące wartości, podzielić zestaw danych na szkolenia i dane wstrzymane oraz wprowadzić funkcje pomocnicze.

Pole Opis
Duplikuj wiersze Nieobsługiwane w przypadku eksperymentów szeregów czasowych.
Dane podpróby Nieobsługiwane w przypadku eksperymentów szeregów czasowych.
Inżynieria elementów tekstowych Nieobsługiwane w przypadku eksperymentów szeregów czasowych.
Ostateczny zestaw danych uczących Wybierz, jakie dane mają być używane podczas szkolenia końcowych rurociągów: tylko dane treningowe, czy dane treningowe i holdout. Jeśli zostanie wybrana opcja uwzględniania tylko danych uczących, wygenerowane zeszyty dla tego eksperymentu będą zawierały komórkę do pobrania danych wstrzymanych używanych do oceny poszczególnych rurociągów.
Funkcje spełniające kryteria Wybierz dodatkowe kolumny z zestawu danych jako funkcje pomocnicze, aby obsługiwać predykcje, a następnie zwiększyć dokładność modelu. Można również użyć wartości przyszłych dla opcji obsługi, włączając opcję Napoje przyszłe wartości opcji pomocniczych.
Uwaga: Opcje pomocnicze można używać tylko z wybranymi algorytmami i rurociągami. Więcej informacji na temat algorytmów i rurociągów, które obsługują użycie funkcji pomocniczych, można znaleźć w sekcji Szczegóły implementacji szeregu czasowego.
Imputacja danych Użyj imputacji danych, aby zastąpić brakujące wartości w zbiorze danych wartościami podstawianych. Włączenie tej opcji umożliwia określenie, w jaki sposób brakujące wartości powinny być interpolowane w danych. Aby dowiedzieć się więcej na temat imputacji danych, zapoznaj się z imputacją danych w eksperymentach AutoAI .
Szkolenia i dane holdout Wybierz, aby zarezerwować niektóre dane z zestawu danych uczących w celu przetestowania eksperymentu. Alternatywnie można przesłać osobny plik danych wstrzymanych. Plik danych holdout musi być zgodny ze schematem danych uczących.

Konfigurowanie danych szeregów czasowych

Aby skonfigurować dane szeregów czasowych, można dostosować ustawienia dla danych szeregów czasowych, które są powiązane z backtesting (eksperyment). Backtesting udostępnia sposób sprawdzania poprawności modelu szeregów czasowych za pomocą danych historycznych.

W typowym eksperymencie uczenia maszynowego można w sposób losowy wstrzymać część danych, aby przetestować wynikowy model w celu zapewnienia dokładności. Aby sprawdzić poprawność modelu szeregów czasowych, należy zachować relację między danymi szkoleniowym a testowaniem danych.

Metoda backtest zawiera następujące kroki:

  1. Długość danych uczących jest określana na podstawie liczby wywołań, długości przerw i wielkości wypustów. Więcej informacji na temat tych parametrów znajduje się w sekcji Budowanie eksperymentu z serią czasową.
  2. Począwszy od najstarszych danych, eksperyment jest przeszkolony z wykorzystaniem danych uczących.
  3. Eksperyment jest oceniany na podstawie pierwszego zestawu danych sprawdzania poprawności. Jeśli długość luki jest niezerowa, wszystkie dane w przerwie są pomijane.
  4. Okno danych uczących jest zaawansowane, zwiększając wielkość holdout i dystans, aby utworzyć nowy zestaw treningowy.
  5. Świeży eksperyment jest przeszkolony w zakresie nowych danych i jest wartościowany przy użyciu kolejnego zestawu danych sprawdzania poprawności.
  6. Poprzednie dwa kroki są powtarzane dla pozostałych okresów.

Aby dopasować konfigurację backtesting:

  1. Otwórz okno Ustawienia eksperymentu.
  2. W obszarze Źródła danychkliknij opcję szeregi czasowe.
  3. (Opcjonalnie): Dostosuj ustawienia, jak pokazano w tabeli.
Pole Opis
Liczba boczków Backtesting jest podobny do walidacji krzyżowej dla okresów data/czas. Opcjonalnie można dostosować liczbę wywołań na potrzeby eksperymentu.
Walidacyjny Wielkość zestawu holdout i każdego zestawu sprawdzania poprawności na potrzeby operacji backtesting. Długość walidacji może być regulowana poprzez zmianę długości holdout.
Długość luki Liczba punktów czasowych między ustawionym zestawem danych uczących a zestawem danych sprawdzania poprawności dla każdego z nich. Jeśli wartość parametru jest niezerowa, wartości szeregu czasowego w przerwie nie będą używane do uczenia eksperymentu lub do oceny bieżącego.

Ustawienia eksperymentu na stronie Źródło danych

Wizualizacja ustawień konfiguracyjnych ilustruje przepływ wsteczny. Grafika jest interaktywna, dzięki czemu można manipulować ustawieniami z grafiki lub z pól konfiguracyjnych. Na przykład, dopasując długość luki, można zobaczyć wyniki sprawdzania poprawności modelu we wcześniejszych okresach danych bez zwiększania liczby wywołań.

Interpretowanie wyników eksperymentu

Po uruchomieniu eksperymentu z serii czasowej można zbadać powstający rurociąg, aby uzyskać informacje na temat szczegółów eksperymentu. Rurociągi, które korzystają z funkcji obsługi, są oznaczone znacznikiem rozszerzenia SUP w celu odróżnienia ich od rurociągów, które nie korzystają z tych funkcji. Aby wyświetlić szczegóły:

  • Umieść wskaźnik myszy nad węzłami w wizualizacji, aby uzyskać szczegółowe informacje na temat potoków w miarę ich generowania.
  • Przełącz się na widok Mapa postępu, aby zobaczyć inny widok procesu uczenia. W celu uzyskania szczegółowych informacji można umieścić wskaźnik myszy nad każdym węzłem w procesie.
  • Po zakończeniu końcowych rurociągów i zapisaniu się na tablicy, można kliknąć rurociąg, aby zobaczyć szczegóły wydajności.
  • Kliknij opcję Wyświetl odrzucone rurociągi , aby wyświetlić algorytmy używane dla rurociągów, które nie są wybrane jako górne wykonawca.
  • Zapisz kod eksperymentu jako notatnik, który można przejrzeć.
  • Zapisz konkretny potok jako notatnik, który można przejrzeć.

Obejrzyj ten film wideo, aby zobaczyć, jak uruchomić eksperyment szeregów czasowych i stworzyć model w notatniku Jupyter przy użyciu szkoleń i danych holdout.

Ten film wideo udostępnia metodę wizualną, która umożliwia poznanie pojęć i zadań w tej dokumentacji.

Następne kroki

Zasoby dodatkowe

Następne kroki

Temat nadrzędny: PrzeglądAutoAI

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more