0 / 0
Go back to the English version of the documentation
Sestavení experimentu časové řady
Last updated: 14. 8. 2023
Sestavení experimentu časové řady

Funkci AutoAI použijte k vytvoření experimentu časových řad pro předpovídání budoucí aktivity, jako jsou například ceny akcií nebo teploty, nad uvedeným datem nebo časovým rozsahem.

Přehled časové řady

Experiment časové řady je metodou prognóz, která používá historické pozorování k předpovídání budoucích hodnot. Experiment automaticky sestavuje mnoho produktovodů s modely strojového učení, jako jsou například náhodné regresní a podpůrné vektorové počítače (SVM), jakož i modely statistických časových řad, jako jsou ARIMA a Holt-Winters. Pak test doporučuje nejlepší propojení procesů podle výkonu propojení procesů vyhodnoceného z datové sady holdingů nebo zpětného testu.

Na rozdíl od standardního experimentu AutoAI , který sestavuje sadu produktovodů k dokončení, je pak očísluje. Test časové řady vyhodnocuje kolony dříve v procesu a pouze dokončuje a testuje ropovody provádějící testování.

Proces generování propojení procesů časové řady AutoAI

Podrobnosti o různých fázích školení a testování experimentu časové řady naleznete v tématu Podrobnosti implementace časové řady.

Predikční anomálie v experimentu časové řady

Můžete nakonfigurovat svůj experiment časové řady a předpovědět anomálie (outliers) ve vašich datech nebo předpovědi. Chcete-li pro svůj experiment nakonfigurovat předpověď anomálií, postupujte podle kroků uvedených v tématu Vytvoření modelu předpovědí anomálie časové řady.

Použití podpůrných funkcí ke zlepšení předpovědí

Při konfiguraci experimentu časové řady můžete zvolit, zda mají být zadány podpůrné funkce, známé také jako vnější funkce. Podpůrné funkce jsou funkce, které ovlivňují nebo přidávají kontext do cíle předpovědi. Pokud například předpovídat prodej zmrzliny, denní teplota by měla být logickou podpůrnou funkcí, která by předpovídá přesnější odhad.

Využití budoucích hodnot pro podpůrné funkce

Pokud znáte budoucí hodnoty podpůrných funkcí, můžete tyto budoucí hodnoty využít při implementaci modelu. Pokud například procvičujete model, který předpovídá budoucí prodej c-shirů, můžete zahrnout propagační slevy jako podpůrnou funkci k vylepšení predikce. Při vložení budoucí hodnoty povýšení bude prognóza přesnější.

Požadavky na údaje

Jedná se o aktuální požadavky na data pro přípravu experimentu časové řady:

  • Výcviková data musí být jeden soubor ve formátu CSV.

  • Soubor musí obsahovat jeden nebo více sloupců časové řady a volitelně obsahovat sloupec časové značky. Seznam podporovaných formátů data a času naleznete v tématu Podrobnosti implementace časové řadyAutoAI.

  • Pokud zdroj dat obsahuje sloupec s časovým razítkem, ujistěte se, že jsou data vzorkována podle jednotné frekvence. To znamená, že rozdíl v časových razítkách sousedních řádků je stejný. Data mohou být například v přírůstcích po 1 minutě, 1 hodinu nebo jeden den. Uvedené časové razítko se používá k určení okna lookatu pro zlepšení přesnosti modelu.

    Pozn.:

    Je-li velikost souboru větší než 1 GB, seřaďte data v pořadí sestupně podle časového razítka a k testování experimentu se použije pouze první 1 GB.

  • Pokud zdroj dat neobsahuje sloupec časové značky, ujistěte se, že jsou data vzorkována v pravidelných intervalech a seřazena ve vzestupném pořadí podle datumu/času vzorku. To znamená, že hodnota v prvním řádku je nejstarší a hodnota v posledním řádku je nejčerstvější.

    Poznámka: Je-li velikost souboru větší než 1 GB, ořízne se soubor tak, aby byl menší než 1 GB.
  • Vyberte, jaká data mají být použita při školení koncových propojení procesů. Rozhodnete-li se zahrnout pouze údaje o školení, generované zápisníky budou obsahovat buňku pro načtení údajů o pouzdře použitých pro vyhodnocení jednotlivých kolon.

Zvolte data z projektu nebo ji odešlete ze svého systému souborů nebo z prohlížeče aktiv, poté klepněte na tlačítko Pokračovat. Klepněte na ikonu náhledu Ikona datové sady náhledu AutoAIpo názvu zdroje dat a přezkoumejte svá data. Volitelně můžete přidat druhý soubor jako zahoněná data pro testování trénovaných kolon.

Konfigurace experimentu časové řady

Když nakonfigurujete podrobnosti pro určitý experiment, klepněte na volbu Ano na volbu Povolit časovou řadu a dokončete podrobnosti o experimentu.

Pole Popis
Sloupce předpovědi Sloupce časové řady, které chcete předpovídat na základě předchozích hodnot. Můžete uvést jeden nebo více sloupců, které se mají předvídat.
Sloupec Datum a čas Sloupec, který označuje datum/čas, kdy došlo k hodnotám časové řady.
Okno Lookback Parametr, který označuje, kolik předchozích hodnot časových řad se používá k předpovědi aktuálního časového bodu.
Okno Prognóza Rozsah, který chcete předpovídat na základě dat v okně lookaté.

Souhrn předpovědí zobrazuje typ experimentu a metriku, která je vybrána pro optimalizaci experimentu.

Konfigurace nastavení experimentu

Chcete-li konfigurovat více podrobností pro váš experiment časové řady, klepněte na volbu Experimentální nastavení.

Obecná nastavení předpovědi

Na panelu Obecné pro nastavení předpovědi můžete volitelně změnit metriku použitou k optimalizaci experimentu nebo určit algoritmy, které mají být generovány, nebo počet ropovodů, které se mají generovat.

Pole Popis
Typ předpovědi Zobrazte nebo změňte typ předpovědi založené na sloupci předpovědi pro váš experiment. Pro experimenty s časovými řadami je standardně vybrána volba Prognóza časové řady .
Poznámka: Změníte-li typ předpovědi, další nastavení předpovědi pro váš experiment se automaticky změní.
Optimalizovaná metrika Zobrazte nebo upravte doporučenou optimalizovanou metriku pro váš experiment.
Optimalizovaný výběr algoritmu Nepodporované pro experimenty s časovými řadami.
Algoritmy k zahrnutí Vyberte algoritmy založené na tom, jak chcete vytvářet kolony. Algoritmy a potrubí, které podporují použití podpůrných funkcí, jsou označeny zaškrtnutím.
Propojení procesů k dokončení Zobrazte nebo změňte počet ropovodů, které se mají pro váš experiment generovat.

Podrobnosti konfigurace časové řady

V podokně Časové řady pro nastavení předpovědi nakonfigurujte podrobnosti pro způsob školení experimentu a generování předpovědí.

Pole Popis
Sloupec Datum a čas Zobrazte nebo změňte sloupec datum/čas pro experiment.
Okno Lookback Zobrazte nebo aktualizujte počet předchozích hodnot časové řady, které se používají k předpovědi aktuálního časového bodu.
Okno Prognóza Zobrazte nebo aktualizujte rozsah, který chcete předpovídat na základě.

Konfigurace nastavení zdroje dat

Chcete-li konfigurovat podrobnosti pro vstupní data, klepněte na volbu Experimentální nastavení a vyberte volbu Zdroj dat.

Obecné nastavení zdroje dat

Na panelu Obecné pro nastavení zdroje dat můžete upravit datovou sadu tak, aby interpoloval chybějící hodnoty, rozdělte datovou sadu na data školení a výzdit data a vstupní podpůrné funkce.

Pole Popis
Duplicitní řádky Nepodporované pro experimenty s časovými řadami.
Ukázková data Nepodporované pro experimenty s časovými řadami.
Technický návrh funkcí Nepodporované pro experimenty s časovými řadami.
Konečná odborná datová sada Vyberte, jaké údaje použít při výcviku konečných potrubí: pouze z údajů o odborné přípravě nebo z údajů o odborné přípravě a výzdích. Rozhodnete-li se zahrnout pouze údaje o školení, budou generované zápisníky pro tento experiment obsahovat buňku pro načtení údajů o pouzdře použitých pro vyhodnocení jednotlivých kolon.
Podpůrné funkce Vyberte další sloupce z datové sady jako Podpůrné funkce pro podporu předpovědí a zvyšte přesnost vašeho modelu. Budoucí hodnoty pro Podpůrné funkce můžete také použít tak, že povolíte Využít budoucí hodnoty podpůrných funkcí.
Poznámka: Můžete používat pouze podpůrné funkce s vybranými algoritmy a produktovody. Další informace o algoritmech a ropovodech podporujících použití podpůrných funkcí naleznete v tématu Podrobnosti implementace časové řady.
imputace dat Použijte imputaci dat k nahrazení chybějících hodnot ve vaší datové sadě substituovanými hodnotami. Povolením této volby můžete uvést, jak by měly být chybějící hodnoty interpolovány ve vašich datech. Chcete-li se dozvědět více o vkládání dat, viz imputace dat v experimentech AutoAI .
Výcvik a výzdro údajů Vyberte si, chcete-li rezervovat některá data ze sady výukových dat pro testování experimentu. Případně odešlete samostatný soubor dat holdout. Datový soubor 'holdout' musí odpovídat schématu dat odborné přípravy.

Konfigurace dat časové řady

Chcete-li nakonfigurovat data časové řady, můžete upravit nastavení pro data časové řady, která souvisejí s zpětnými testy experimentu. Zpětné testování poskytuje prostředek k ověření platnosti modelu časové řady pomocí historických dat.

V typickém experimentu se studiem se můžete držet část dat náhodně, abyste otestovali výsledný model pro přesnost. Chcete-li ověřit model časové řady, musíte zachovat vztah časového pořadí mezi daty o školení a testovacími daty.

Následující kroky popisují metodu zpětného testu:

  1. Délka dat proškolování je určena na základě počtu zpětných testů, délky mezery a velikosti výtěhonu. Další informace o těchto parametrech naleznete v tématu Budování experimentu časových řad.
  2. Od nejstarších dat je experiment vyškolen pomocí údajů o školení.
  3. Experiment se vyhodnocuje na první ověřovací datové sadě. Je-li délka mezery nenulová, budou veškerá data v mezeře přeskočena.
  4. Okno s údaji o školení se zvyšuje zvýšením velikosti pouzdro a délkou mezery, aby se vytvořila nová sada výukových programů.
  5. Nový experiment je vycvičen s novými daty a vyhodnocuje se při příští ověřovací datové sadě.
  6. Předchozí dva kroky jsou opakovány pro zbývající období zpětného testování.

Chcete-li upravit konfiguraci zpětného testování:

  1. Otevřete Experimentální nastavení.
  2. V části Zdroje datklepněte na položku Časová řada.
  3. (Volitelné): Upravte nastavení tak, jak je zobrazeno v tabulce.
Pole Popis
Počet zpětných testů Zpětné testování je podobné křížovému ověření platnosti pro období data/času. Volitelně upravte počet zpětných testů pro váš experiment.
Zadržení Velikost sady pouzdro a každá ověřovací sada pro zpětné testování. Délku ověření platnosti lze upravit změnou délky výhonu.
Délka mezery Počet časových bodů mezi sadou dat školení a datovou sadou ověření platnosti pro každý zpětný test. Je-li hodnota parametru nenulová, hodnoty časové řady v této mezeře nebudou použity pro zkoušku experimentu nebo vyhodnocení aktuálního zpětného testu.

Experimentovat nastavení na stránce Zdroj dat

Vizualizace pro nastavení konfigurace ilustruje tok zpětného testování. Grafika je interaktivní, takže můžete manipulovat s nastavením z grafických nebo z konfiguračních polí. Například úpravou délky mezery si můžete prohlédnout výsledky ověření platnosti modelu v dřívějších časových obdobích dat bez zvýšení počtu zpětných testů.

Interpretace výsledků experimentu

Po spuštění testu časové řady můžete prozkoumat výsledné kolony, abyste získali představu o detailech experimentu. Potrubní vedení, které používají podpůrné funkce, je označeno značkou rozšíření SUP, aby je odlišilo od ropovodů, které tyto funkce nepoužívají. Zobrazení podrobností:

  • Podržte ukazatel myši nad uzly ve vizualizaci, abyste získali podrobnosti o ropovodech, jak jsou generovány.
  • Přepnutím na pohled Mapa průběhu se zobrazí jiný pohled na proces školení. Podrobnosti získáte přesunutím ukazatele myši nad každý uzel v procesu.
  • Po dokončení a zápisu konečných kolon do leaderboard můžete klepnout na kolonu a zobrazit podrobnosti o výkonu.
  • Klepnutím na volbu Zobrazit odložené kanály zobrazíte algoritmy, které se používají pro kolony, které nejsou vybrány jako hlavní vykonavatelé.
  • Uložte kód experimentu jako zápisník, který můžete zkontrolovat.
  • Uložte konkrétní kolonu jako zápisník, který můžete přezkoumat.

Podívejte se na toto video, abyste viděli, jak spustit test časové řady a vytvořit model v notebooku Jupyter pomocí školení a data holdout.

Právní omezení pro video: Některé méně významné kroky a grafické prvky v tomto videu se mohou lišit od vaší platformy.

Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.

Další kroky

Další prostředky

Další kroky

Nadřízené téma: PřehledAutoAI

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more