Translation not up to date
Grafický nástroj AutoAI analyzuje vaše data a používá algoritmy dat, transformace a nastavení parametrů k vytvoření nejlepšího prediktivního modelu. Funkce AutoAI zobrazí různé potenciální modely jako potenciální model produktových řad a řadí je na základní desku, ze které si můžete vybírat.
- Požadovaná služba
- Watson Machine Learning
- Watson Studio
- Formát dat
- Tabulkové: CSV soubory, s čárkou (,) oddělovačem pro všechny typy experimentů AutoAI .
- Připojená data z produktu IBM Cloud Object Storage.
Můžete použít datové aktivum, které je uloženo jako Skupina funkcí (beta) , ale metadata nejsou použita k naplnění nastavení experimentu AutoAI .
- Velikost dat
- Až 1 GB nebo až 20 GB. Podrobnosti najdete v tématu Použití datAutoAI.
Použití dat AutoAI
Tyto limity jsou založeny na výchozí konfiguraci výpočtu 8 CPU a 32 GB.
Klasifikace AutoAI a regresní experimenty:
- Můžete odeslat soubor až 1 GB pro experimenty AutoAI .
- Pokud se připojíte ke zdroji dat, který přesahuje 1 GB, použije se pouze první 1 GB záznamů.
Experimenty časových řad AutoAI :
Pokud zdroj dat obsahuje sloupec s časovým razítkem, AutoAI vzorkuje data s jednotnou frekvencí. Např. data mohou být v přírůstcích po jedné minutě, jedné hodině nebo jeden den. Uvedené časové razítko se používá k určení okna lookatu pro zlepšení přesnosti modelu.
Pozn.:Je-li velikost souboru větší než 1 GB, AutoAi seřadí data v sestupném pořadí času a pouze první 1 GB se použije k trénování experimentu.
Pokud zdroj dat neobsahuje sloupec s časovou značkou, ujistěte se, že AutoAI vzorkuje data v jednotných intervalech a setřídí data ve vzestupném časovém pořadí. Vzestupné pořadí řazení znamená, že hodnota v prvním řádku je nejstarší a hodnota v posledním řádku je nejčerstvější.
Poznámka: Je-li velikost souboru větší než 1 GB, zkráťte velikost souboru tak, aby byla menší než 1 GB.
Další informace o výběru správného nástroje pro data a použití případu najdete v tématu Výběr nástroje.
Proces AutoAI
Pomocí AutoAImůžete sestavit a implementovat model strojového učení s propracovanými funkcemi školení a bez kódování. Nástroj dělá většinu práce pro vás.
Chcete-li zobrazit kód, který vytvořil určitý experiment, nebo interaktivně spolupracovat s experimentem, můžete uložit experiment jako notebook.
AutoAI automaticky spustí následující úlohy pro sestavení a vyhodnocení kandidátských ropovodů modelu:
- Předběžné zpracování dat
- Automatický výběr modelu
- Automatizované inženýrství funkcí
- Optimalizace hyperparametru
Základní informace o procesu AutoAI
Další podrobnosti o každé z těchto fází, včetně odkazů na související výzkumné papíry a popisy algoritmů použitých k vytvoření modelového propojení procesů, najdete v tématu Podrobnosti implementaceAutoAI.
Předběžné zpracování dat
Většina datových sad obsahuje různé formáty dat a chybějící hodnoty, ale standardní algoritmy pro výuku počítačů fungují pouze s čísly a bez chybějících hodnot. Proto AutoAI používá různé algoritmy nebo odhadce k analýze, vyčištění a přípravě vašich nezpracovaných dat pro výuku počítače. Tato technika automaticky zjišťuje a kategorizuje hodnoty na základě funkcí, jako je datový typ: kategorická nebo číselná. V závislosti na kategorizaci AutoAI používá optimalizaci hyper-parameter k určení nejlepší kombinace strategií pro imputaci chybějící hodnoty, kódování funkcí a škálování funkcí pro vaše data.
Automatický výběr modelu
Volba AutoAI používá automatický výběr modelu k identifikaci nejlepšího modelu pro vaše data. Tento nový přístup testuje potenciální modely proti malým dílům dat a řadí je na základě přesnosti. Funkce AutoAI poté vybere nejperspektivnější modely a zvýší velikost dílčí sady dat, dokud nebude identifikovat nejlepší shodu. Tento přístup šetří čas a zlepšuje výkon tím, že postupně snižuje případné modely na základě přesnosti.
Informace o tom, jak zpracovat automaticky generované kolony pro výběr nejlepšího modelu, najdete v tématu Výběr modelu AutoAI.
Automatizované inženýrství funkcí
Technické vybavení funkce identifikuje nejpřesnější model transformací nezpracovaných dat do kombinace funkcí, které nejlépe představují daný problém. Tento jedinečný přístup zkoumá různé možnosti stavební konstrukce ve strukturovaném, nevyčerpávajícím způsobem a zároveň postupně maximalizuje přesnost modelu využitím výztuží učení. Tato technika vede k optimalizovanému pořadí transformací pro data, která nejlépe odpovídají algoritmům kroku výběru modelu.
Optimalizace hyperparametru
Optimalizace pro Hyperparametr zpřesňuje nejlepší modely, které provádějí práci. AutoAI používá nový algoritmus optimalizace hyperparametru pro určitá vyhodnocení funkcí, jako je např. modelování pomocí modelu a hodnocení, které jsou typické pro výuku počítače. Tento přístup rychle identifikuje nejlepší model přes dlouhé vyhodnocovací časy v jednotlivých iteracích.
Další kroky
Výukový programAutoAI : Sestavení modelu binární klasifikace
Nadřízené téma: Analýza dat a modelů budov