Translation not up to date
Tento výukový program použijte pro práci s vysoce kvalitními a chráněnými daty po dokončení výukového programu Curate high quality data a výukového programu Protect your data tutorial s případem použití řízení dat zkušební verze prostředí Fabric. Vaším cílem je vyhodnotit, sdílet, tvarovat a analyzovat data v datovém prostředí Fabric.
Příběh výukového programu spočívá v tom, že Golden Bank má několik oddělení, která potřebují přístup k vysoce kvalitním zákaznickým hypotečním datům. Jako datový analytik budete muset vyhledat a najít správná data, porozumět jejich obsahu a důvěřovat jim a poté je připravit pro použití ostatními datovými analytiky a datovými specialisty.
Následující animovaný obrázek poskytuje rychlý náhled toho, čeho dosáhnete na konci tohoto výukového programu, kde uvidíte aktiva katalogu, ručně obohatíte aktiva a vytvoříte vztahy, vizualizujete data a filtrujete data, abyste zlepšili kvalitu. Chcete-li zobrazit větší obrázek, klepněte na obrázek.
Zobrazit náhled výukového programu
V tomto výukovém programu dokončíte tyto úlohy:
- Nastavte předpoklady.
- Úloha 1: Porozumění datovým aktivům.
- Úloha 2: Zkvalitnění aktiv a vytvoření vztahů.
- Úloha 3: Přidat obohacená data do projektu.
- Úloha 4: Vizualizovat data.
- Úloha 5: Příprava dat pro analýzu a umělou inteligenci.
- Vyčištění (volitelné)
Chcete-li zobrazit náhled kroků v tomto výukovém programu, podívejte se na toto video. V uživatelském rozhraní zobrazeném ve videu mohou být malé rozdíly. Video je určeno jako společník písemného výukového programu.
Toto video poskytuje vizuální metodu, jak se seznámit s koncepty a úlohami v této dokumentaci.
Použití obrazového videa v obraze
Tip: Spusťte video a při procházení výukovým programem se video přesune do režimu obrazu v obraze. Zavřete video obsah pro nejlepší zážitek s obrazem v obraze. Můžete použít režim obrazu v obraze, takže můžete sledovat video po dokončení úloh v tomto výukovém programu. Klepněte na časová razítka pro každou úlohu, kterou chcete sledovat.Následující animovaný obrázek ukazuje, jak používat obrazový obraz v obraze a obsah:
Získejte pomoc v komunitě
Potřebujete-li pomoc s tímto výukovým programem, můžete položit otázku nebo najít odpověď v diskusním fóru komunity Cloud Pak for Data.
Nastavení oken prohlížeče
Chcete-li získat optimální zkušenost s dokončením tohoto výukového programu, otevřete Cloud Pak for Data v jednom okně prohlížeče a ponechte tuto stránku výukového programu otevřenou v jiném okně prohlížeče, abyste snadno přepínali mezi oběma aplikacemi. Zvažte uspořádání dvou oken prohlížeče vedle sebe, abyste usnadnili sledování.
Tip: Pokud při provádění tohoto výukového programu v uživatelském rozhraní narazíte na asistovanou prohlídku, klepněte na Možná později.
Zpět na začátek
Kompletní nezbytné výukové programy
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:39.
Dokončete výukové programy Curate high quality data a Protect your data :
- Výukový program Curate high quality data pro import a obohacení datových aktiv a jejich publikování do katalogu.
- Výukový program Ochrana dat pro vytvoření pravidel ochrany dat a maskovacích toků pro ochranu dat.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 01:12.
Datová aktiva v katalozích jsou mnohem více než ukazatele na data. Obsahují informace o formátu a významu dat a statistiky o datových hodnotách. Chcete-li porozumět hodnotě datových aktiv, postupujte takto:
V navigační nabídce Cloud Pak for Data vyberte volbu Katalogy > Zobrazit všechny katalogy.
Otevřete Katalog schválení hypotéky.
Sekce Nejlepší aktiva zobrazuje Nedávno přidaná aktiva, aktiva, která produkt Watson doporučuje , což jsou navrhovaná aktiva z umělé inteligence a strojového učení na základě vašeho dřívějšího využití a oblíbenosti, a vysoce hodnocená aktiva, která katalogizují spolupracovníky, ohodnocená a přezkoumaná.
Klepnutím na volbu Skrýt nabízená aktiva zavřete tuto sekci.
Vyhledejte řetězec
mortgage
.Klepnutím na volbu HYPOTÉAGE_APPLICANTS_TRUST zobrazíte aktivum katalogu. Karta Přehled a postranní panel poskytují základní informace o aktivu, jako např. popis, hodnocení, značky, kde je aktivum umístěno, obchodní podmínky, datové třídy a související položky.
Klepněte na kartu Profil . Informace o profilu vám pomohou porozumět obsahu, kvalitě a použitelnosti dat.
Posuňte se doprava a vyhledejte sloupec ZIP_CODE .
Datová třída, která byla automaticky přiřazena ke sloupci ZIP_CODE , je Komerční a vládní entita. Všimněte si, že automaticky přiřazená datová třída se může lišit. Vzhledem k tomu, že hodnoty jsou PSČ, můžete tento sloupec snadno překlasifikovat. Klepnutím na rozevírací seznam zobrazíte další možné třídy dat a jejich úrovně důvěryhodnosti. Vyberte volbu PSČ (US).
Klepnutím na kartu Aktivum zobrazíte náhled dat.
Vraťte se na kartu Přehled a zobrazte další metadata o sloupcích. V seznamu sloupců vyhledejte sloupec EMPLOYMENT_STATUS , abyste viděli metadata včetně přiřazených obchodních výrazů.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje aktivum HYPOTÉAGE_APPLICANTS_TRUST v katalogu. Prozkoumali jste typ informací, které produkt Watson Knowledge Catalog automaticky přidává do datových aktiv během obohacování metadat. V další úloze ručně obohatíte toto datové aktivum.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 02:49.
Aktiva mohou být cennější, pokud k nim přidáte informace. Můžete například přidat svůj názor na aktivum, aktualizovat vlastnosti aktiva a vytvořit relace pro propojení aktiv. Chcete-li obohatit aktiva a vytvořit relace, postupujte takto:
Pro aktivum katalogu HYPOTÉAGE_APPLICANTS_TRUST klepněte na kartu Revize . Ohodnoťte a okomentujte toto aktivum, aby ostatní mohli aktivum snadno najít.
Pro hodnocení vyberte 5 hvězdiček .
Pro přezkoumání zkopírujte a vložte následující text:
This contains high quality customer data from the mortgage system.
Klepněte na tlačítko Odeslat.
Klepněte na kartu Přehled.
Chcete-li upravit název aktiva, klepněte na ikonu Upravit vedle názvu aktiva.
Změňte název na:
MORTGAGE_APPLICANTS_TRUST_PROTECT
Klepněte na tlačítko Použít.
V sekci Popis v pravém postranním panelu klepněte na tlačítko Přidat .
Pozn.:Pokud má toto aktivum existující popis, zobrazí se namísto ikony Přidat ikona Upravit .
Zkopírujte a vložte následující popis:
Mortgage applicants from the Mortgage System
Klepněte na tlačítko Použít.
Protože se toto aktivum týká hypotečních úvěrů, klepněte vedle volby Obchodní podmínkyna ikonu Přidat .
Do pole Hledat zadejte
loan
.Poznámka: Po zadání hledaného výrazu není nutné stisknout klávesu Enter. Seznam výsledků se zobrazí ihned po zadání hledaného výrazu.Vyberte volbu Půjčka.
Klepněte na tlačítko Přidat.
Protože toto aktivum obsahuje osobní informace, klepněte vedle volby Klasifikacena ikonu Přidat .
Vyberte volbu Osobně identifikovatelné informace.
Klepněte na tlačítko Přidat.
Protože toto aktivum souvisí s jinými hypotečními aktivy, klepněte vedle položky Související položkyna volbu Přidat související položky > Přidat související aktiva.
Vyberte volbu souvisí sa klepněte na tlačítko Další.
Vyberte aktiva CREDIT_SCORE a HYPOTÉKA_APLIKACE a klepněte na tlačítko Přidat.
Klepnutím na volbu HYPOTÉAGE_APPLICATION zobrazíte související aktivum.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje kartu Přehled pro aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT v katalogu. Tato aktiva jste ocenili přezkoumáním, aktualizací vlastností a přidáním relací k aktivům. V další úloze přidáte obohacené aktivum do projektu.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 04:09.
Tým datových analytiků potřebuje data žadatelů o hypotéku v projektu analýzy hypotéky pro upřesnění, vizualizaci, analýzu a použití jako trénovací data pro modely. Chcete-li přidat obohacená data do projektu, postupujte takto:
V navigační cestě klepněte na volbu Katalog schválení hypotéky .
Na konci řádku aktiva katalogu HYPOTÉAGE_APPLICANTS_TRUST_PROTECT klepněte na nabídku Přetečení a vyberte volbu Přidat do projektu.
V rozevíracím seznamu Cíl vyberte projekt regulace dat .
Klepněte na tlačítko Přidat.
Po zobrazení oznámení klepněte na volbu Přejít na projekt. Pokud vám oznámení chybí, pak:
Klepněte na navigační nabídku Cloud Pak for Data a vyberte volbu Projekty > Zobrazit všechny projekty.
Klepněte na projekt Správa dat .
V projektu klepněte na kartu Aktiva , abyste viděli datové aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT .
Zkontrolujte svůj pokrok
Následující obrázek ukazuje aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT v projektu. Nyní jste připraveni vizualizovat data.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 04:39.
Musíte vyčistit a upřesnit data žadatelů o hypotéku, abyste je připravili pro vaše analytické nástroje a modely. Rychlým a snadným způsobem, jak zjistit, jak je třeba jej tvarovat, je vizualizovat data v Data Refinery. Vizualizace je založena na prvních 5 000 řádcích dat. Chcete-li vizualizovat data, postupujte takto:
Klepnutím na datové aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT zobrazte náhled dat.
Klepnutím na volbu Připravit data otevřete datové aktivum v Data Refinerya počkejte na čtení a zpracování dat.
Na panelu O tomto aktivu klepněte na tlačítko X , abyste panel zavřeli.
Na panelu Kroky klepněte na tlačítko X a panel zavřete.
Klepněte na kartu Vizualizace .
Pro sloupec pro vizualizacivyberte volbu EMPLOYMENT_STATUS.
Klepněte na volbu Vizualizovat data. Nástroj vybere výsečový graf jako nejlepší typ grafu pro tento sloupec, který zobrazuje rozdělení uchazečů podle stavu zaměstnání. Všimněte si navržených typů grafů, které jsou označeny modrou tečkou vedle sloupce, shluku slov a sunburst.
Pro Typ grafuvyberte typ grafu Bublina . Bublinový graf je jednoduchý způsob, jak rychle vizualizovat rozdělení hodnot v konkrétní datové sadě.
V rozevírací nabídce Typ grafu vyberte typ grafu Vztah .
Tento typ grafu vyžaduje dva sloupce. Vyberte tyto sloupce:
Pro první sloupec vyberte EMPLOYMENT_STATUS.
Klepněte na volbu Přidat další sloupec.
Pro druhý sloupecvyberte volbu EDUCATION.
Pomocí grafu Vztah můžete vybrat koncové body pro zobrazení vztahů. Můžete například vidět uchazeče o zaměstnání podle úrovně vzdělání.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje aktivum HYPOTÉAGE_APPLICANTS_TRUST_PROTECT vizualizované v Data Refinery. Nyní jste připraveni vyčistit data.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 05:59.
Nemůžete zpracovat uchazeče bez čísla sociálního zabezpečení, takže musíte zkontrolovat údaje a odstranit všechny uchazeče bez čísla sociálního zabezpečení. Při přípravě dat HYPOTÉAGE_APPLICANTS_TRUST_PROTECT postupujte takto:
- Zobrazte frekvenci hodnot ve sloupci Social_Security_Number.
- Filtrujte uchazeče s chybějícími hodnotami ve sloupci Social_Security_Number.
Chcete-li připravit data, postupujte takto:
V Data Refineryklepněte na kartu Profil .
Posuňte se vpravo a vyhledejte sloupec Social_Security_Number . Všimněte si několika chybějících hodnot.
Klepnutím na kartu Data tyto záznamy odfiltrujte. Ve stavovém řádku v dolní části obrazovky Data Refinery označuje, že FULL DATA SET je 1101 řádků.
Pokud panel Kroky není viditelný, klepnutím na volbu Kroky otevřete panel.
Klepněte na volbu Nový krok.
V sekci Vyčistit vyberte volbu Filtr.
V poli Sloupec vyberte sloupec Social_Security_Number .
V poli Operátor vyberte volbu Není prázdný.
Klepněte na tlačítko Použít. Všimněte si, že ve stavovém řádku v dolní části obrazovky Data Refinery nyní označuje, že ÚPLNÁ SADA DAT je 1000 řádků, protože řádky s chybějícími čísly sociálního zabezpečení jsou odfiltrovány. Všimněte si, že se na panelu Kroky zobrazí nový krok zobrazující operaci Filtr .
Klepněte na kartu Profil .
Posuňte se vpravo a vyhledejte sloupec Social_Security_Number . Všimněte si, že chybějící hodnoty jsou pryč.
Na panelu nástrojů klepněte na ikonu Uložit .
Na panelu nástrojů klepněte na ikonu Exportovat a vyberte volbu Exportovat aktuální data do CSV.
Uložte soubor MORTGAGE_APPLICANTS_TRUST_PROTECT_shaped.csv do lokální složky.
Přejděte do této složky a otevřete soubor CSV, který obsahuje 1000 řádků a žádnému uchazeči chybí číslo sociálního zabezpečení.
Vraťte se do Cloud Pak for Dataa klepněte na projekt Data Governance v navigační cestě.
Klepněte na volbu Všechna aktivaa vyhledejte nové aktivum toku Data Refinery s názvem MORTGAGE_APPLICANTS_TRUST_PROTECT_flow.
Tip: Zpřesněné datové sady můžete uložit do projektu nebo do externího zdroje dat, například do instance Db2 Warehouse , kde jsou uloženy původní datové sady. Další informace naleznete v tématu Vytváření úloh v části Data Refinery.Zkontrolujte svůj pokrok
Následující obrázek ukazuje soubor MORTGAGE_APPLICANTS_TRUST_PROTECT_shaped.csv , který jste upřesňili v Data Refinery. Tato datová sada obsahuje informace o žadatelích o hypotéku, kteří poskytli číslo sociálního zabezpečení.
Zpět na začátek
Jako datový analytik společnosti Golden Bank jste se naučili, jak hledat a najít správná data, porozumět jejich obsahu a důvěřovat jim a poté je připravit pro použití ostatními datovými analytiky a datovými specialisty.
Vyčištění (volitelné)
Chcete-li znovu použít výukové programy v příkladu použití regulace dat, odstraňte následující artefakty.
Artefakt | Jak odstranit |
---|---|
Importované obchodní podmínky | Odstranit artefakty řízení |
Bankovní kategorie | Odstranit kategorii |
Pravidla ochrany osobních údajů: Důvěrné informace a číslo sociálního zabezpečení Redact | Odstranit pravidla ochrany dat |
Katalog schválení hypotéky | Odstranit katalog |
Ukázkový projekt řízení dat | Odstranění projektu |
Další kroky
Vyzkoušejte výukový program virtualizovaných dat typu Govern.
Vyzkoušejte Výukový program Konfigurace 360stupňových zobrazení.
Přihlaste se k jinému případu použití prostředí Fabric dat.
Další informace
Nadřízené téma: Výukové programy datového prostředí Fabric