0 / 0
Go back to the English version of the documentation
Výukový program pro řízení dat: Spotřebujte svá data
Last updated: 09. 11. 2023
Výukový program pro řízení dat: Spotřebujte svá data

Tento výukový program použijte pro práci s vysoce kvalitními a chráněnými daty po dokončení výukového programu Curate high quality data a výukového programu Protect your data tutorial s případem použití řízení dat zkušební verze prostředí Fabric. Vaším cílem je vyhodnotit, sdílet, tvarovat a analyzovat data v datovém prostředí Fabric.

Stručný úvod: Pokud jste dosud nevytvořili ukázkový projekt pro tento výukový program, přistupte k ukázkovému projektu řízení dat v galerii.

Příběh výukového programu spočívá v tom, že Golden Bank má několik oddělení, která potřebují přístup k vysoce kvalitním zákaznickým hypotečním datům. Jako datový analytik budete muset vyhledat a najít správná data, porozumět jejich obsahu a důvěřovat jim a poté je připravit pro použití ostatními datovými analytiky a datovými specialisty.

Následující animovaný obrázek poskytuje rychlý náhled toho, čeho dosáhnete na konci tohoto výukového programu, kde uvidíte aktiva katalogu, ručně obohatíte aktiva a vytvoříte vztahy, vizualizujete data a filtrujete data, abyste zlepšili kvalitu. Chcete-li zobrazit větší obrázek, klepněte na obrázek.

Animovaný obrázek

Zobrazit náhled výukového programu

V tomto výukovém programu dokončíte tyto úlohy:

Zhlédnout video Chcete-li zobrazit náhled kroků v tomto výukovém programu, podívejte se na toto video. V uživatelském rozhraní zobrazeném ve videu mohou být malé rozdíly. Video je určeno jako společník písemného výukového programu.

Toto video poskytuje vizuální metodu, jak se seznámit s koncepty a úlohami v této dokumentaci.



  • Použití obrazového videa v obraze

    Tip: Spusťte video a při procházení výukovým programem se video přesune do režimu obrazu v obraze. Zavřete video obsah pro nejlepší zážitek s obrazem v obraze. Můžete použít režim obrazu v obraze, takže můžete sledovat video po dokončení úloh v tomto výukovém programu. Klepněte na časová razítka pro každou úlohu, kterou chcete sledovat.

    Následující animovaný obrázek ukazuje, jak používat obrazový obraz v obraze a obsah:

    Jak používat obrázky v obraze a kapitoly

    Získejte pomoc v komunitě

    Potřebujete-li pomoc s tímto výukovým programem, můžete položit otázku nebo najít odpověď v diskusním fóru komunity Cloud Pak for Data.

    Nastavení oken prohlížeče

    Chcete-li získat optimální zkušenost s dokončením tohoto výukového programu, otevřete Cloud Pak for Data v jednom okně prohlížeče a ponechte tuto stránku výukového programu otevřenou v jiném okně prohlížeče, abyste snadno přepínali mezi oběma aplikacemi. Zvažte uspořádání dvou oken prohlížeče vedle sebe, abyste usnadnili sledování.

    Vedlejší výukový program a uživatelské rozhraní

    Tip: Pokud při provádění tohoto výukového programu v uživatelském rozhraní narazíte na asistovanou prohlídku, klepněte na Možná později.

    Zpět na začátek

  • Kompletní nezbytné výukové programy

    náhled výukového videa Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:39.

    Dokončete výukové programy Curate high quality data a Protect your data :

    • Výukový program Curate high quality data pro import a obohacení datových aktiv a jejich publikování do katalogu.
    • Výukový program Ochrana dat pro vytvoření pravidel ochrany dat a maskovacích toků pro ochranu dat.

    Zpět na začátek


  • náhled výukového videa Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 01:12.

    Datová aktiva v katalozích jsou mnohem více než ukazatele na data. Obsahují informace o formátu a významu dat a statistiky o datových hodnotách. Chcete-li porozumět hodnotě datových aktiv, postupujte takto:

    1. V navigační nabídce Cloud Pak for Data Navigační nabídkavyberte volbu Katalogy > Zobrazit všechny katalogy.

    2. Otevřete Katalog schválení hypotéky.

    3. Sekce Nejlepší aktiva zobrazuje Nedávno přidaná aktiva, aktiva, která produkt Watson doporučuje , což jsou navrhovaná aktiva z umělé inteligence a strojového učení na základě vašeho dřívějšího využití a oblíbenosti, a vysoce hodnocená aktiva, která katalogizují spolupracovníky, ohodnocená a přezkoumaná.

    4. Klepnutím na volbu Skrýt nabízená aktiva zavřete tuto sekci.

    5. Vyhledejte řetězec mortgage.

    6. Klepnutím na volbu HYPOTÉAGE_APPLICANTS_TRUST zobrazíte aktivum katalogu. Karta Přehled a postranní panel poskytují základní informace o aktivu, jako např. popis, hodnocení, značky, kde je aktivum umístěno, obchodní podmínky, datové třídy a související položky.

    7. Klepněte na kartu Profil . Informace o profilu vám pomohou porozumět obsahu, kvalitě a použitelnosti dat.

    8. Posuňte se doprava a vyhledejte sloupec ZIP_CODE .

    9. Datová třída, která byla automaticky přiřazena ke sloupci ZIP_CODE , je Komerční a vládní entita. Všimněte si, že automaticky přiřazená datová třída se může lišit. Vzhledem k tomu, že hodnoty jsou PSČ, můžete tento sloupec snadno překlasifikovat. Klepnutím na rozevírací seznam zobrazíte další možné třídy dat a jejich úrovně důvěryhodnosti. Vyberte volbu PSČ (US).

    10. Klepnutím na kartu Aktivum zobrazíte náhled dat.

    11. Vraťte se na kartu Přehled a zobrazte další metadata o sloupcích. V seznamu sloupců vyhledejte sloupec EMPLOYMENT_STATUS , abyste viděli metadata včetně přiřazených obchodních výrazů.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje aktivum HYPOTÉAGE_APPLICANTS_TRUST v katalogu. Prozkoumali jste typ informací, které produkt Watson Knowledge Catalog automaticky přidává do datových aktiv během obohacování metadat. V další úloze ručně obohatíte toto datové aktivum.

    Aktivum HYPOTÉKA_APPLICANTS_TRUST


    Zpět na začátek


  • náhled výukového videa Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 02:49.

    Aktiva mohou být cennější, pokud k nim přidáte informace. Můžete například přidat svůj názor na aktivum, aktualizovat vlastnosti aktiva a vytvořit relace pro propojení aktiv. Chcete-li obohatit aktiva a vytvořit relace, postupujte takto:

    1. Pro aktivum katalogu HYPOTÉAGE_APPLICANTS_TRUST klepněte na kartu Revize . Ohodnoťte a okomentujte toto aktivum, aby ostatní mohli aktivum snadno najít.

      1. Pro hodnocení vyberte 5 hvězdiček .

      2. Pro přezkoumání zkopírujte a vložte následující text:

        This contains high quality customer data from the mortgage system.
        
      3. Klepněte na tlačítko Odeslat.

    2. Klepněte na kartu Přehled.

    3. Chcete-li upravit název aktiva, klepněte na ikonu Upravit Ikona Upravit vedle názvu aktiva.

      1. Změňte název na:

        MORTGAGE_APPLICANTS_TRUST_PROTECT
        
      2. Klepněte na tlačítko Použít.

    4. V sekci Popis v pravém postranním panelu klepněte na tlačítko Přidat Přidat ikonu.

      Pozn.:

      Pokud má toto aktivum existující popis, zobrazí se namísto ikony Přidat ikona Upravit Ikona Upravit .

      1. Zkopírujte a vložte následující popis:

        Mortgage applicants from the Mortgage System
        
      2. Klepněte na tlačítko Použít.

    5. Protože se toto aktivum týká hypotečních úvěrů, klepněte vedle volby Obchodní podmínkyna ikonu Přidat Přidat ikonu.

      1. Do pole Hledat zadejte loan.

        Poznámka: Po zadání hledaného výrazu není nutné stisknout klávesu Enter. Seznam výsledků se zobrazí ihned po zadání hledaného výrazu.
      2. Vyberte volbu Půjčka.

      3. Klepněte na tlačítko Přidat.

    6. Protože toto aktivum obsahuje osobní informace, klepněte vedle volby Klasifikacena ikonu Přidat Přidat ikonu .

      1. Vyberte volbu Osobně identifikovatelné informace.

      2. Klepněte na tlačítko Přidat.

    7. Protože toto aktivum souvisí s jinými hypotečními aktivy, klepněte vedle položky Související položkyna volbu Přidat související položky > Přidat související aktiva.

      1. Vyberte volbu souvisí sa klepněte na tlačítko Další.

      2. Vyberte aktiva CREDIT_SCORE a HYPOTÉKA_APLIKACE a klepněte na tlačítko Přidat.

    8. Klepnutím na volbu HYPOTÉAGE_APPLICATION zobrazíte související aktivum.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje kartu Přehled pro aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT v katalogu. Tato aktiva jste ocenili přezkoumáním, aktualizací vlastností a přidáním relací k aktivům. V další úloze přidáte obohacené aktivum do projektu.

    HYPOTÉAGE_APPLICANTS_TRUST se souvisejícími aktivy


    Zpět na začátek


  • náhled výukového videa Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 04:09.

    Tým datových analytiků potřebuje data žadatelů o hypotéku v projektu analýzy hypotéky pro upřesnění, vizualizaci, analýzu a použití jako trénovací data pro modely. Chcete-li přidat obohacená data do projektu, postupujte takto:

    1. V navigační cestě klepněte na volbu Katalog schválení hypotéky .
      Navigační cesta

    2. Na konci řádku aktiva katalogu HYPOTÉAGE_APPLICANTS_TRUST_PROTECT klepněte na nabídku Překryvná nabídka Přetečení a vyberte volbu Přidat do projektu.

      1. V rozevíracím seznamu Cíl vyberte projekt regulace dat .

      2. Klepněte na tlačítko Přidat.

    3. Po zobrazení oznámení klepněte na volbu Přejít na projekt. Pokud vám oznámení chybí, pak:

      1. Klepněte na navigační nabídku Cloud Pak for Data Navigační nabídkaa vyberte volbu Projekty > Zobrazit všechny projekty.

      2. Klepněte na projekt Správa dat .

    4. V projektu klepněte na kartu Aktiva , abyste viděli datové aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT .

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT v projektu. Nyní jste připraveni vizualizovat data.

    HYPOTÉKA_APPLICANTS_TRUST_PROTECT aktiva v projektu


    Zpět na začátek


  • náhled výukového videa Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 04:39.

    Musíte vyčistit a upřesnit data žadatelů o hypotéku, abyste je připravili pro vaše analytické nástroje a modely. Rychlým a snadným způsobem, jak zjistit, jak je třeba jej tvarovat, je vizualizovat data v Data Refinery. Vizualizace je založena na prvních 5 000 řádcích dat. Chcete-li vizualizovat data, postupujte takto:

    1. Klepnutím na datové aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT zobrazte náhled dat.

    2. Klepnutím na volbu Připravit data otevřete datové aktivum v Data Refinerya počkejte na čtení a zpracování dat.

    3. Na panelu O tomto aktivu klepněte na tlačítko X , abyste panel zavřeli.

    4. Na panelu Kroky klepněte na tlačítko X a panel zavřete.

    5. Klepněte na kartu Vizualizace .

    6. Pro sloupec pro vizualizacivyberte volbu EMPLOYMENT_STATUS.

    7. Klepněte na volbu Vizualizovat data. Nástroj vybere výsečový graf jako nejlepší typ grafu pro tento sloupec, který zobrazuje rozdělení uchazečů podle stavu zaměstnání. Všimněte si navržených typů grafů, které jsou označeny modrou tečkou vedle sloupce, shluku slov a sunburst.

    8. Pro Typ grafuvyberte typ grafu Bublina . Bublinový graf je jednoduchý způsob, jak rychle vizualizovat rozdělení hodnot v konkrétní datové sadě.

    9. V rozevírací nabídce Typ grafu vyberte typ grafu Vztah .

    10. Tento typ grafu vyžaduje dva sloupce. Vyberte tyto sloupce:

      1. Pro první sloupec vyberte EMPLOYMENT_STATUS.

      2. Klepněte na volbu Přidat další sloupec.

      3. Pro druhý sloupecvyberte volbu EDUCATION.

    11. Pomocí grafu Vztah můžete vybrat koncové body pro zobrazení vztahů. Můžete například vidět uchazeče o zaměstnání podle úrovně vzdělání.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT vizualizované v Data Refinery. Nyní jste připraveni vyčistit data.

    Vizualizace vztahů


    Zpět na začátek


  • náhled výukového videa Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 05:59.

    Nemůžete zpracovat uchazeče bez čísla sociálního zabezpečení, takže musíte zkontrolovat údaje a odstranit všechny uchazeče bez čísla sociálního zabezpečení. Při přípravě dat HYPOTÉAGE_APPLICANTS_TRUST_PROTECT postupujte takto:

    • Zobrazte frekvenci hodnot ve sloupci Social_Security_Number.
    • Filtrujte uchazeče s chybějícími hodnotami ve sloupci Social_Security_Number.

    Chcete-li připravit data, postupujte takto:

    1. V Data Refineryklepněte na kartu Profil .

    2. Posuňte se vpravo a vyhledejte sloupec Social_Security_Number . Všimněte si několika chybějících hodnot.

    3. Klepnutím na kartu Data tyto záznamy odfiltrujte. Ve stavovém řádku v dolní části obrazovky Data Refinery označuje, že FULL DATA SET je 1101 řádků.

    4. Pokud panel Kroky není viditelný, klepnutím na volbu Kroky otevřete panel.

    5. Klepněte na volbu Nový krok.

      1. V sekci Vyčistit vyberte volbu Filtr.

      2. V poli Sloupec vyberte sloupec Social_Security_Number .

      3. V poli Operátor vyberte volbu Není prázdný.

      4. Klepněte na tlačítko Použít. Všimněte si, že ve stavovém řádku v dolní části obrazovky Data Refinery nyní označuje, že ÚPLNÁ SADA DAT je 1000 řádků, protože řádky s chybějícími čísly sociálního zabezpečení jsou odfiltrovány. Všimněte si, že se na panelu Kroky zobrazí nový krok zobrazující operaci Filtr .

    6. Klepněte na kartu Profil .

    7. Posuňte se vpravo a vyhledejte sloupec Social_Security_Number . Všimněte si, že chybějící hodnoty jsou pryč.

    8. Na panelu nástrojů klepněte na ikonu Ikona Uložit Uložit .

    9. Na panelu nástrojů klepněte na ikonu Exportovat a vyberte volbu Exportovat aktuální data do CSV.
      Exportovat jako ikonu csv

      1. Uložte soubor MORTGAGE_APPLICANTS_TRUST_PROTECT_shaped.csv do lokální složky.

      2. Přejděte do této složky a otevřete soubor CSV, který obsahuje 1000 řádků a žádnému uchazeči chybí číslo sociálního zabezpečení.

    10. Vraťte se do Cloud Pak for Dataa klepněte na projekt Data Governance v navigační cestě.
      Navigační cesta

    11. Klepněte na volbu Všechna aktivaa vyhledejte nové aktivum toku Data Refinery s názvem MORTGAGE_APPLICANTS_TRUST_PROTECT_flow.

    Tip: Zpřesněné datové sady můžete uložit do projektu nebo do externího zdroje dat, například do instance Db2 Warehouse , kde jsou uloženy původní datové sady. Další informace naleznete v tématu Vytváření úloh v části Data Refinery.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje soubor MORTGAGE_APPLICANTS_TRUST_PROTECT_shaped.csv , který jste upřesňili v Data Refinery. Tato datová sada obsahuje informace o žadatelích o hypotéku, kteří poskytli číslo sociálního zabezpečení.

    Upřesněný datový zdroj


    Zpět na začátek

Jako datový analytik společnosti Golden Bank jste se naučili, jak hledat a najít správná data, porozumět jejich obsahu a důvěřovat jim a poté je připravit pro použití ostatními datovými analytiky a datovými specialisty.

Vyčištění (volitelné)

Chcete-li znovu použít výukové programy v příkladu použití regulace dat, odstraňte následující artefakty.

Artefakt Jak odstranit
Importované obchodní podmínky Odstranit artefakty řízení
Bankovní kategorie Odstranit kategorii
Pravidla ochrany osobních údajů: Důvěrné informace a číslo sociálního zabezpečení Redact Odstranit pravidla ochrany dat
Katalog schválení hypotéky Odstranit katalog
Ukázkový projekt řízení dat Odstranění projektu

Další kroky

Další informace

Nadřízené téma: Výukové programy datového prostředí Fabric

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more