Translation not up to date
Příprava dat pro analýzu je jedním z nejdůležitějších kroků v každém projektu-a tradičně, jeden z nejvíce časově náročné. Automatizovaná příprava dat (automatizovaná příprava dat) zpracovává úkol pro vás, analyzuje data a identifikuje opravy, prozkoumá pole, která jsou problematická, nebo není pravděpodobné, že by mohla být užitečná, podle potřeby odvození nových atributů a zlepšení výkonu pomocí inteligentních screeningových technik. Algoritmus můžete používat plně automaticky způsobem, který umožňuje výběr a použití oprav, nebo jej můžete použít v interaktivním způsobem, náhled změn před jejich učiněním a přijetím nebo odmítnutím těchto změn, jak chcete.
Pomocí ADP vám umožní rychle a snadno připravit vaše data pro modelové budovy, aniž byste potřebovali předchozí znalosti o souvisejících statistických pojmech. Modely budou mít tendenci sestavovat a skórovat rychleji
Příklad. Pojistná společnost s omezenými prostředky na vyšetření pojistných nároků majitele domu chce vytvořit model pro označování podezřelých, potenciálně podvodných nároků. Před sestavením modelu budou připraveny data pro modelování pomocí automatizovaného zpracování dat. Vzhledem k tomu, že chtějí být schopni přezkoumat navrhované transformace dříve, než budou použity transformace, použijí automatizovanou přípravu dat v interaktivním režimu.
Skupina v automobilovém průmyslu uchovává záznamy o prodeji různých osobních motorových vozidel. Ve snaze být schopni identifikovat více než a nedostatečně výkonné modely, chtějí vytvořit vztah mezi prodejem vozidel a charakteristikou vozidla. Budou používat automatizovanou přípravu dat k přípravě dat pro analýzu a sestaví modely s použitím dat "před" a "po", abychom zjistili, jak se výsledky liší.
Jaký je váš cíl? Automatizovaná příprava dat doporučuje kroky přípravy dat, které budou mít vliv na rychlost, s jakou mohou ostatní algoritmy vytvářet modely a zlepšovat prediktivní výkon těchto modelů. To může zahrnovat transformaci, konstrukci a výběr funkcí. Cíl lze také transformovat. Můžete určit priority pro sestavení modelu, na které se má proces přípravy dat soustředit.
- Vyvážení rychlosti a přesnosti. Tato volba připravuje data tak, aby měla stejnou prioritu jak rychlosti, se kterými jsou data zpracovávána algoritmem sestavováním modelu, a s přesností předpovědí.
- Optimalizovat na rychlost. Tato volba připravuje data tak, aby upřednostňovala rychlost, s jakou jsou data zpracovávána algoritmem sestavováním modelu. Pokud pracujete s velmi velkými datovými sadami, nebo pokud hledáte rychlou odpověď, vyberte tuto volbu.
- Optimalizujte na přesnost. Tato volba připravuje data tak, aby upřednostňoval přesnost předpovědí vytvářená algoritmem sestavováním modelů.
- Vlastní analýza. Chcete-li ručně změnit algoritmus na kartě Nastavení, vyberte tuto volbu. Všimněte si, že toto nastavení je automaticky vybráno, pokud následně změníte volby na kartě Nastavení, které jsou nekompatibilní s jedním z dalších cílů.
Školení uzlu
Uzel ADP je implementován jako uzel procesu a pracuje podobným způsobem jako uzel typu; training ADP uzel odpovídá vytvoření instance uzlu Typ. Po provedení analýzy se uvedené transformace použijí na data bez další analýzy, dokud se datový model na počátku nezmění. Podobně jako uzly typu a filtru, je-li uzel ADP odpojen, pamatuje si datový model a transformace, takže pokud je znovu připojen, nepotřebuje být znovu vycvičen; to vám umožní vycvičit ji na podmnožině typických dat a pak ji kopírovat nebo implementovat pro použití na živých datech tak často, jak je to požadováno.