Translation not up to date
Pomocí toku DataStage můžete snadno integrovat, vyčistit a analyzovat data z různorodých zdrojů dat. Přečtěte si o nástroji DataStage , pak se podívejte na video a udělejte si výukový program, který je vhodný pro uživatele s určitými znalostmi transformace dat, ale nevyžaduje kódování.
- Nezbytné služby
- Watson Studio
- DataStage
Váš základní sled prací zahrnuje tyto úlohy:
- Vytvořte projekt. Projekty jsou místa, kde můžete spolupracovat s ostatními při práci s daty.
- Přidejte data do projektu. Můžete přidat soubory CSV nebo data ze vzdáleného zdroje dat prostřednictvím připojení.
- Vytvořte tok DataStage .
- Proveďte kroky s použitím operací pro upřesnění dat.
- Vytvořte a spusťte úlohu pro transformaci dat.
Přečtěte si o DataStage
DataStage je nástroj ETL (extract, transform, and load), který můžete použít k transformaci a integraci dat v projektech.
Produkt DataStage je navržen pro snadné použití a je plně integrován do produktu Cloud Pak for Data. Existující starší paralelní úlohy můžete importovat do produktu DataStage pomocí souborů ISX, pomocí plátna DataStage můžete vytvářet, upravovat a testovat toky a spouštět úlohy generované z toků.
Podívejte se na video o transformaci dat pomocí toku DataStage .
Podívejte se na toto video, abyste viděli, jak vytvořit jednoduchý tok DataStage .
Toto video poskytuje vizuální metodu, jak se seznámit s koncepty a úlohami v této dokumentaci.
Vyzkoušejte výukový program pro transformaci dat
V tomto výukovém programu dokončíte tyto úlohy:
- Úloha 1: Otevřít projekt.
- Úloha 2: Přidejte datovou sadu do svého projektu.
- Úloha 3: Vytvořte tok DataStage .
- Úloha 4: Upravit uzly.
- Úloha 5: Spusťte tok DataStage a zobrazte aktivum.
Dokončení tohoto výukového programu bude trvat přibližně 20 minut.
Použití obrazového videa v obraze
Tip: Spusťte video a při procházení výukovým programem se video přesune do režimu obrazu v obraze. Zavřete video obsah pro nejlepší zážitek s obrazem v obraze. Můžete použít režim obrazu v obraze, takže můžete sledovat video po dokončení úloh v tomto výukovém programu. Klepněte na časová razítka pro každou úlohu, kterou chcete sledovat.Následující animovaný obrázek ukazuje, jak používat obrazový obraz v obraze a obsah:
Získejte pomoc v komunitě
Potřebujete-li pomoc s tímto výukovým programem, můžete položit otázku nebo najít odpověď v diskusním fóru komunity Cloud Pak for Data.
Nastavení oken prohlížeče
Chcete-li získat optimální zkušenost s dokončením tohoto výukového programu, otevřete Cloud Pak for Data v jednom okně prohlížeče a ponechte tuto stránku výukového programu otevřenou v jiném okně prohlížeče, abyste snadno přepínali mezi oběma aplikacemi. Zvažte uspořádání dvou oken prohlížeče vedle sebe, abyste usnadnili sledování.
Tip: Pokud při provádění tohoto výukového programu v uživatelském rozhraní narazíte na asistovanou prohlídku, klepněte na Možná později.
Zpět na začátek
Potřebujete projekt k uložení datové sady a toku DataStage a musíte zajistit službu DataStage . Chcete-li otevřít existující projekt nebo vytvořit nový projekt a zajistit službu, postupujte takto:
V navigační nabídce Cloud Pak for Data vyberte volbu Projekty > Zobrazit všechny projekty .
Pokud máte existující projekt, otevřete jej.
Pokud nemáte existující projekt, klepněte na volbu Nový projekt.
Vyberte volbu Vytvořit prázdný projekt.
Zadejte název a volitelný popis projektu.
Klepněte na volbu Vytvořit.
V navigační nabídce klepněte na volbu Služby > Instance služeb.
Klepněte na volbu Přidat službu a vyberte volbu DataStage.
Klepněte na volbu Vytvořit. Zajištěnou službu uvidíte na stránce Instance služby .
Další informace nebo sledování videa naleznete v tématu Vytvoření projektu.
Zkontrolujte svůj pokrok
Následující obrázek zobrazuje zajištěné služby.
Zpět na začátek
Datová sada použitá v tomto výukovém programu je k dispozici v galerii. Chcete-li najít datovou sadu v galerii a přidat ji do svého projektu, postupujte takto:
Přistupte k datové sadě zákazníků v galerii.
Klepněte na volbu Přidat do projektu.
Vyberte projekt ze seznamu a klepněte na tlačítko Přidat.
Po přidání datové sady klepněte na volbu Zobrazit projekt.
Další informace o přidávání datových aktiv z galerie do projektu naleznete v tématu Načítání a přístup k datům v zápisníku.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje kartu Aktiva v projektu.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:26.
Tok DataStage bude obsahovat čtyři uzly: původní datové aktivum, uzel filtru, uzel řazení a transformované datové aktivum. Chcete-li vytvořit tok DataStage , postupujte takto:
Klepněte na volbu Nové aktivum > DataStage tok.
Zadejte název a popis a poté klepněte na volbu Vytvořit.
Klepněte na volbu Konektory a přetáhněte uzel Prohlížeč aktiv na plátno.
Vyberte volbu Datové aktivum > customers.csva klepněte na tlačítko Přidat.
Na paletě uzlůrozbalte sekci Fáze a přetáhněte uzel Filtr na plátno.
Chcete-li spojit uzly dohromady, klepněte na modrou šipku na uzlu Customers.csv a přetáhněte ji do uzlu Filtr .
V sekci Fáze přetáhněte uzel Řadit na plátno.
Připojte uzel Filtr k uzlu Řadit .
Rozbalte sekci Konektory a poté přetáhněte uzel Prohlížeč aktiv na plátno.
Vyberte volbu Datové aktivum > customers.csva klepněte na tlačítko Přidat. Název souboru změníte později, abyste nepřepsali soubor customer.csv .
Připojte uzel Řadit k tomuto poslednímu uzlu Customers.csv .
Zkontrolujte svůj pokrok
Následující obrázek ukazuje počáteční tok DataStage .
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 03:27.
Chcete-li upravit vlastnosti pro každý uzel na plátně, postupujte takto:
Uzel 1: Úprava prvního uzlu prohlížeče aktiv
Poklepejte na první uzel Customer.csv .
Na panelu Vlastnosti vpravo přejmenujte uzel na
Customer Table
, abyste přejmenovali uzel aktiva.Klepněte na kartu Výstup .
Rozbalte sekci Sloupce a klepněte na tlačítko Upravit.
Pro sloupec YTD_SALES klepněte na VARCHAR a vyberte DECIMAL , abyste změnili datový typ sloupce YTD_SALES .
Klepnutím na tlačítko Použít a vrátit se se vrátíte na panel Vlastnosti.
Klepnutím na tlačítko Uložit uložte změny do uzlu Tabulka zákazníků .
Uzel 2: Úprava uzlu filtru
Poklepejte na uzel Filtr .
Na panelu Vlastnosti přejmenujte text
Filter_1
naFilter YTD Sales
, abyste přejmenovali uzel filtru.Rozbalte sekci Vlastnosti . V části Predikátyklepněte na volbu Upravit.
Klepněte na volbu Přidat klauzuli Where.
Ve sloupci Klauzule Where zadejte
YTD_SALES > 1000
.Klepněte na volbu Použít a vrátit se.
Klepněte na kartu Výstup .
Rozbalte sekci Sloupce a klepněte na tlačítko Upravit.
Vyberte všechny sloupce a zrušte výběr následujících sloupců uvedených níže, které budou uchovány pro tento výukový program.
- ID_CUST_ID
- CUSTNAME
- COUNTRY_CODE
- ADRESA_E-MAILU
- PHONE_NUMBER
- PRODEJ_YTD_PRODEJE
- SALESREP_ID
Klepnutím na ikonu koše odstraníte zbývající vybrané sloupce.
Ve sloupci CUSTNAME jej přejmenujte na
CUSTOMERNAME
. Tato změna se rozšíří na uzly, které následují za uzlem Filtr .Klepnutím na tlačítko Použít a vrátit se se vrátíte na panel Vlastnosti.
Klepnutím na tlačítko Uložit uložte změny do uzlu Filtr .
Uzel 3: Upravit uzel řazení
Poklepejte na uzel Řadit .
Na panelu Vlastnosti přejmenujte text
Sort_1
naSort YTD Sales
, abyste přejmenovali uzel řazení.Rozbalte sekci Vlastnosti .
V části Řazení klíčůklepněte na volbu Upravit.
Klepněte na tlačítko Přidat klíč.
V rozevírací nabídce Klíč vyberte volbu YTD_SALES.
V poli Pořadí řazenívyberte volbu Sestupně.
Klepnutím na tlačítko Použít se vrátíte na seznam klíčů řazení.
Klepnutím na tlačítko Použít a vrátit se se vrátíte na panel Vlastnosti.
Klepněte na kartu Vstup a rozbalte sekci Sloupce , abyste ověřili, že se název sloupce CUSTOMERNAME rozšíří z uzlu Filtr .
Klepněte na kartu Výstup a rozbalte sekci Sloupce , abyste ověřili, že se název sloupce CUSTOMERNAME rozšíří z uzlu Filtr .
Klepnutím na tlačítko Uložit uložte změny do uzlu Řadit .
Uzel 4: Úprava posledního uzlu prohlížeče aktiv
Poklepejte na poslední uzel Customers.csv .
Na panelu Vlastnosti přejmenujte uzel na
Customer filtered table
, abyste přejmenovali uzel aktiva.Rozbalte sekci Vlastnosti a označte zaškrtávací políčko Vytvořit datové aktivum.
Do pole Název datového aktiva zadejte
Customers filtered
a klepněte na tlačítko Uložit.Klepněte na kartu Vstup a rozbalte sekci Sloupce , abyste ověřili, že se název sloupce CUSTOMERNAME rozšíří z uzlu Filtr .
Klepnutím na tlačítko Uložit uložte změny do uzlu Filtrovaná tabulka zákazníků .
Zkontrolujte svůj pokrok
Následující obrázek ukazuje konečný tok DataStage .
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 06:36.
Nyní jste připraveni spustit tok. Chcete-li spustit tok a zobrazit transformované aktivum v projektu, postupujte takto:
Klepněte na tlačítko Uložit.
Klepněte na volbu Kompilace.
Klepněte na volbu Spustit.
(Volitelné) Klepnutím na odkaz Protokol zobrazíte podrobnosti spuštění.
Poklepejte na poslední uzel Filtrovaná tabulka zákazníků .
Rozbalte sekci Vlastnosti .
Posuňte se dolů a klepněte na volbu Náhled dat. Můžete vidět, že data byla správně filtrována a seřazena.
Klepněte na panel Graf .
Pro Sloupce pro vizualizacivyberte volbu YTD_SALES.
Pro Typ grafuklepněte na Q-Q plot.
Klepněte na Zavřít.
Vzhledem k tomu, že jste nastavili tok pro vytvoření datového aktiva v projektu, klepněte na název projektu v navigační cestě, abyste se vrátili do vašeho projektu.
Na kartě Aktiva otevřete aktivum Filtrované zákazníky .
Zkontrolujte svůj pokrok
Následující obrázek zobrazuje datové aktivum filtrované zákazníky.
Zpět na začátek
Další kroky
Nyní jsou data připravena k použití. Například vy nebo jiní uživatelé můžete provést některou z těchto úloh:
Vyzkoušejte další výukové programy:
Přidejte datové aktivum do katalogu, abyste je sdíleli s vaší organizací
Další prostředky
Zobrazte další videa pro toky DataStage.
Začněte s ukázkovým projektem DataStage : COVID-19 Sledování pomocí produktu IBM DataStage.
Vyhledejte ukázkové datové sady, abyste získali praktické zkušenosti s transformací dat v Galerii.
Vyzkoušejte tento další výukový program, abyste získali více praktických zkušeností s toky DataStage : Začněte používat novou službu IBM DataStage .
Nadřízené téma: Výukové programy rychlého spuštění