0 / 0
Go back to the English version of the documentation
Stručný úvod: Transformace dat
Last updated: 09. 11. 2023
Stručný úvod: Transformace dat

Pomocí toku DataStage můžete snadno integrovat, vyčistit a analyzovat data z různorodých zdrojů dat. Přečtěte si o nástroji DataStage , pak se podívejte na video a udělejte si výukový program, který je vhodný pro uživatele s určitými znalostmi transformace dat, ale nevyžaduje kódování.

Nezbytné služby
Watson Studio
DataStage

Váš základní sled prací zahrnuje tyto úlohy:

  1. Vytvořte projekt. Projekty jsou místa, kde můžete spolupracovat s ostatními při práci s daty.
  2. Přidejte data do projektu. Můžete přidat soubory CSV nebo data ze vzdáleného zdroje dat prostřednictvím připojení.
  3. Vytvořte tok DataStage .
  4. Proveďte kroky s použitím operací pro upřesnění dat.
  5. Vytvořte a spusťte úlohu pro transformaci dat.

Přečtěte si o DataStage

DataStage je nástroj ETL (extract, transform, and load), který můžete použít k transformaci a integraci dat v projektech.

Produkt DataStage je navržen pro snadné použití a je plně integrován do produktu Cloud Pak for Data. Existující starší paralelní úlohy můžete importovat do produktu DataStage pomocí souborů ISX, pomocí plátna DataStage můžete vytvářet, upravovat a testovat toky a spouštět úlohy generované z toků.

Další informace o produktu DataStage

Podívejte se na video o transformaci dat pomocí toku DataStage .

Zhlédnout video Podívejte se na toto video, abyste viděli, jak vytvořit jednoduchý tok DataStage .

Toto video poskytuje vizuální metodu, jak se seznámit s koncepty a úlohami v této dokumentaci.

Vyzkoušejte výukový program pro transformaci dat

V tomto výukovém programu dokončíte tyto úlohy:

Dokončení tohoto výukového programu bude trvat přibližně 20 minut.



  • Použití obrazového videa v obraze

    Tip: Spusťte video a při procházení výukovým programem se video přesune do režimu obrazu v obraze. Zavřete video obsah pro nejlepší zážitek s obrazem v obraze. Můžete použít režim obrazu v obraze, takže můžete sledovat video po dokončení úloh v tomto výukovém programu. Klepněte na časová razítka pro každou úlohu, kterou chcete sledovat.

    Následující animovaný obrázek ukazuje, jak používat obrazový obraz v obraze a obsah:

    Jak používat obrázky v obraze a kapitoly

    Získejte pomoc v komunitě

    Potřebujete-li pomoc s tímto výukovým programem, můžete položit otázku nebo najít odpověď v diskusním fóru komunity Cloud Pak for Data.

    Nastavení oken prohlížeče

    Chcete-li získat optimální zkušenost s dokončením tohoto výukového programu, otevřete Cloud Pak for Data v jednom okně prohlížeče a ponechte tuto stránku výukového programu otevřenou v jiném okně prohlížeče, abyste snadno přepínali mezi oběma aplikacemi. Zvažte uspořádání dvou oken prohlížeče vedle sebe, abyste usnadnili sledování.

    Vedlejší výukový program a uživatelské rozhraní

    Tip: Pokud při provádění tohoto výukového programu v uživatelském rozhraní narazíte na asistovanou prohlídku, klepněte na Možná později.

    Zpět na začátek


  • Potřebujete projekt k uložení datové sady a toku DataStage a musíte zajistit službu DataStage . Chcete-li otevřít existující projekt nebo vytvořit nový projekt a zajistit službu, postupujte takto:

    1. V navigační nabídce Cloud Pak for Data Navigační nabídkavyberte volbu Projekty > Zobrazit všechny projekty .

    2. Pokud máte existující projekt, otevřete jej.

    3. Pokud nemáte existující projekt, klepněte na volbu Nový projekt.

    4. Vyberte volbu Vytvořit prázdný projekt.

    5. Zadejte název a volitelný popis projektu.

    6. Klepněte na volbu Vytvořit.

    7. V navigační nabídce Navigační nabídkaklepněte na volbu Služby > Instance služeb.

    8. Klepněte na volbu Přidat službu a vyberte volbu DataStage.

    9. Klepněte na volbu Vytvořit. Zajištěnou službu uvidíte na stránce Instance služby .

    Další informace nebo sledování videa naleznete v tématu Vytvoření projektu.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek zobrazuje zajištěné služby.

    Následující obrázek zobrazuje zajišťované služby.


    Zpět na začátek


  • Datová sada použitá v tomto výukovém programu je k dispozici v galerii. Chcete-li najít datovou sadu v galerii a přidat ji do svého projektu, postupujte takto:

    1. Přistupte k datové sadě zákazníků v galerii.

    2. Klepněte na volbu Přidat do projektu.

    3. Vyberte projekt ze seznamu a klepněte na tlačítko Přidat.

    4. Po přidání datové sady klepněte na volbu Zobrazit projekt.

    Další informace o přidávání datových aktiv z galerie do projektu naleznete v tématu Načítání a přístup k datům v zápisníku.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje kartu Aktiva v projektu.

    Následující obrázek zobrazuje kartu Aktiva v projektu.


    Zpět na začátek


  • náhled výukového videa Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:26.

    Tok DataStage bude obsahovat čtyři uzly: původní datové aktivum, uzel filtru, uzel řazení a transformované datové aktivum. Chcete-li vytvořit tok DataStage , postupujte takto:

    1. Klepněte na volbu Nové aktivum > DataStage tok.

    2. Zadejte název a popis a poté klepněte na volbu Vytvořit.

    3. Klepněte na volbu Konektory a přetáhněte uzel Prohlížeč aktiv na plátno.

    4. Vyberte volbu Datové aktivum > customers.csva klepněte na tlačítko Přidat.

    5. Na paletě uzlůrozbalte sekci Fáze a přetáhněte uzel Filtr na plátno.

    6. Chcete-li spojit uzly dohromady, klepněte na modrou šipku na uzlu Customers.csv a přetáhněte ji do uzlu Filtr .

    7. V sekci Fáze přetáhněte uzel Řadit na plátno.

    8. Připojte uzel Filtr k uzlu Řadit .

    9. Rozbalte sekci Konektory a poté přetáhněte uzel Prohlížeč aktiv na plátno.

    10. Vyberte volbu Datové aktivum > customers.csva klepněte na tlačítko Přidat. Název souboru změníte později, abyste nepřepsali soubor customer.csv .

    11. Připojte uzel Řadit k tomuto poslednímu uzlu Customers.csv .

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje počáteční tok DataStage .

    Následující obrázek ukazuje počáteční tok DataStage .


    Zpět na začátek


  • náhled výukového videa Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 03:27.

    Chcete-li upravit vlastnosti pro každý uzel na plátně, postupujte takto:

    Uzel 1: Úprava prvního uzlu prohlížeče aktiv

    1. Poklepejte na první uzel Customer.csv .

    2. Na panelu Vlastnosti vpravo přejmenujte uzel na Customer Table , abyste přejmenovali uzel aktiva.

    3. Klepněte na kartu Výstup .

    4. Rozbalte sekci Sloupce a klepněte na tlačítko Upravit.

    5. Pro sloupec YTD_SALES klepněte na VARCHAR a vyberte DECIMAL , abyste změnili datový typ sloupce YTD_SALES .

    6. Klepnutím na tlačítko Použít a vrátit se se vrátíte na panel Vlastnosti.

    7. Klepnutím na tlačítko Uložit uložte změny do uzlu Tabulka zákazníků .

    Uzel 2: Úprava uzlu filtru

    1. Poklepejte na uzel Filtr .

    2. Na panelu Vlastnosti přejmenujte text Filter_1 na Filter YTD Sales , abyste přejmenovali uzel filtru.

    3. Rozbalte sekci Vlastnosti . V části Predikátyklepněte na volbu Upravit.

      1. Klepněte na volbu Přidat klauzuli Where.

      2. Ve sloupci Klauzule Where zadejte YTD_SALES > 1000.

      3. Klepněte na volbu Použít a vrátit se.

    4. Klepněte na kartu Výstup .

    5. Rozbalte sekci Sloupce a klepněte na tlačítko Upravit.

      1. Vyberte všechny sloupce a zrušte výběr následujících sloupců uvedených níže, které budou uchovány pro tento výukový program.

        • ID_CUST_ID
        • CUSTNAME
        • COUNTRY_CODE
        • ADRESA_E-MAILU
        • PHONE_NUMBER
        • PRODEJ_YTD_PRODEJE
        • SALESREP_ID
      2. Klepnutím na ikonu koše odstraníte zbývající vybrané sloupce.

      3. Ve sloupci CUSTNAME jej přejmenujte na CUSTOMERNAME. Tato změna se rozšíří na uzly, které následují za uzlem Filtr .

      4. Klepnutím na tlačítko Použít a vrátit se se vrátíte na panel Vlastnosti.

    6. Klepnutím na tlačítko Uložit uložte změny do uzlu Filtr .

    Uzel 3: Upravit uzel řazení

    1. Poklepejte na uzel Řadit .

    2. Na panelu Vlastnosti přejmenujte text Sort_1 na Sort YTD Sales , abyste přejmenovali uzel řazení.

    3. Rozbalte sekci Vlastnosti .

    4. V části Řazení klíčůklepněte na volbu Upravit.

      1. Klepněte na tlačítko Přidat klíč.

      2. V rozevírací nabídce Klíč vyberte volbu YTD_SALES.

      3. V poli Pořadí řazenívyberte volbu Sestupně.

      4. Klepnutím na tlačítko Použít se vrátíte na seznam klíčů řazení.

      5. Klepnutím na tlačítko Použít a vrátit se se vrátíte na panel Vlastnosti.

    5. Klepněte na kartu Vstup a rozbalte sekci Sloupce , abyste ověřili, že se název sloupce CUSTOMERNAME rozšíří z uzlu Filtr .

    6. Klepněte na kartu Výstup a rozbalte sekci Sloupce , abyste ověřili, že se název sloupce CUSTOMERNAME rozšíří z uzlu Filtr .

    7. Klepnutím na tlačítko Uložit uložte změny do uzlu Řadit .

    Uzel 4: Úprava posledního uzlu prohlížeče aktiv

    1. Poklepejte na poslední uzel Customers.csv .

    2. Na panelu Vlastnosti přejmenujte uzel na Customer filtered table , abyste přejmenovali uzel aktiva.

    3. Rozbalte sekci Vlastnosti a označte zaškrtávací políčko Vytvořit datové aktivum.

    4. Do pole Název datového aktiva zadejte Customers filtereda klepněte na tlačítko Uložit.

    5. Klepněte na kartu Vstup a rozbalte sekci Sloupce , abyste ověřili, že se název sloupce CUSTOMERNAME rozšíří z uzlu Filtr .

    6. Klepnutím na tlačítko Uložit uložte změny do uzlu Filtrovaná tabulka zákazníků .

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje konečný tok DataStage .

    Následující obrázek ukazuje konečný tok DataStage .


    Zpět na začátek


  • náhled výukového videa Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 06:36.

    Nyní jste připraveni spustit tok. Chcete-li spustit tok a zobrazit transformované aktivum v projektu, postupujte takto:

    1. Klepněte na tlačítko Uložit.

    2. Klepněte na volbu Kompilace.

    3. Klepněte na volbu Spustit.

    4. (Volitelné) Klepnutím na odkaz Protokol zobrazíte podrobnosti spuštění.

    5. Poklepejte na poslední uzel Filtrovaná tabulka zákazníků .

    6. Rozbalte sekci Vlastnosti .

    7. Posuňte se dolů a klepněte na volbu Náhled dat. Můžete vidět, že data byla správně filtrována a seřazena.

      1. Klepněte na panel Graf .

      2. Pro Sloupce pro vizualizacivyberte volbu YTD_SALES.

      3. Pro Typ grafuklepněte na Q-Q plot.

      4. Klepněte na Zavřít.

    8. Vzhledem k tomu, že jste nastavili tok pro vytvoření datového aktiva v projektu, klepněte na název projektu v navigační cestě, abyste se vrátili do vašeho projektu.

    9. Na kartě Aktiva otevřete aktivum Filtrované zákazníky .

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek zobrazuje datové aktivum filtrované zákazníky.

    Následující obrázek zobrazuje datové aktivum filtrované zákazníky.


    Zpět na začátek

Další kroky

Nyní jsou data připravena k použití. Například vy nebo jiní uživatelé můžete provést některou z těchto úloh:

Další prostředky

Nadřízené téma: Výukové programy rychlého spuštění

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more