Translation not up to date
Syntetická tabulková data můžete generovat v IBM watsonx.ai. Výhoda pro syntetická data je, že můžete obstarat data na vyžádání, pak upravit tak, aby vyhovovala vašemu případu použití, a vytvořit jej ve velkém množství. Tento výukový program vám pomůže naučit se používat nástroj grafického editoru toků, Synthetic Data Generator, ke generování syntetických tabulkových dat na základě produkčních dat nebo vlastního datového schématu pomocí vizuálních toků a modelovacích algoritmů.
- Požadované služby
- Watson Studio
Váš základní sled prací zahrnuje tyto úlohy:
- Otevřete projekt. Projekty jsou místem, kde můžete spolupracovat s ostatními na práci s daty.
- Přidejte data do projektu. Do připojení můžete přidat soubory CSV nebo data ze vzdáleného zdroje dat.
- Vytvořte a spusťte syntetický tok dat do projektu. Pomocí nástroje grafického editoru toků Synthetic Data Generator můžete generovat syntetická tabulková data na základě produkčních dat nebo vlastního datového schématu pomocí vizuálních toků a modelovacích algoritmů.
- Zkontrolujte tok syntetických dat a výstup.
Číst o syntetických datech
Syntetická data jsou informace, které byly generovány na počítači pro rozšíření nebo nahrazení reálných dat za účelem zlepšení modelů AI, ochrana citlivých dat a zmírnění zkreslení. Syntetická data pomáhají zmírnit mnohé z logistických, etických a osobních problémů, které jsou dodávány se studijovými modely počítačů v reálném světě-příklady.
Podívejte se na video o generování syntetických tabulkových dat
Chcete-li si prohlédnout kroky uvedené v tomto výukovém programu, pusťte toto video. V uživatelském rozhraní zobrazeném ve videu může dojít k mírnému rozdílu. Video je zamýšleno jako společník k písemnému výukovém programu.
Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.
Zkuste výukový program pro generování syntetických tabulkových dat
V tomto výukovém programu provedete tyto úlohy:
- Úloha 1: Otevřít projekt
- Úloha 2: Přidat data do svého projektu
- Úloha 3: Vytvořit syntetický datový tok
- Úloha 4: Přezkoumání datového toku a výstupu
Použití obrazového videa v obraze
Tip: Spusťte video a při procházení výukovým programem se video přesune do režimu obrazu v obraze. Zavřete video obsah pro nejlepší zážitek s obrazem v obraze. Můžete použít režim obrazu v obraze, takže můžete sledovat video po dokončení úloh v tomto výukovém programu. Klepněte na časová razítka pro každou úlohu, kterou chcete sledovat.Následující animovaný obrázek ukazuje, jak používat obrazový obraz v obraze a obsah:
Získání nápovědy pro komunitu
Potřebujete-li pomoc s tímto výukovým programem, můžete položit otázku nebo najít odpověď v diskusním fóru komunity Cloud Pak for Data.
Nastavení oken prohlížeče
Pro optimální zkušenost s tímto výukovým programem otevřete Cloud Pak for Data v jednom okně prohlížeče a ponechejte tuto stránku s výukovým programem otevřenou v jiném okně prohlížeče, abyste mohli snadno přepínat mezi dvěma aplikacemi. Zvažte uspořádání dvou oken prohlížeče bok po boku tak, aby se usnadnila jeho následná práce.
Tip: Pokud při dokončování tohoto výukového programu v uživatelském rozhraní narazíte na prohlídku s průvodcem, klepněte na volbu Možná později.
Zpět na začátek
K uložení aktiv potřebujete projekt.
Podívejte se na video, abyste viděli, jak vytvořit projekt pískoviště a přidružit službu. Poté postupujte podle kroků a ověřte, zda máte existující projekt, nebo vytvořte projekt prostředí sandbox.
Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.
Na domovské obrazovce watsonx přejděte do sekce Projekty . Pokud vidíte některé uvedené projekty, pak přeskočte na Úloha 2. Pokud žádné projekty nevidíte, postupujte podle níže uvedených kroků a vytvořte projekt.
Klepněte na volbu Vytvořit projekt pískoviště. Po vytvoření projektu se projekt sandboxu zobrazí v sekci Projekty .
Další informace nebo sledování videa naleznete v tématu Vytvoření projektu.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje domovskou obrazovku se sandboxem uvedeným v sekci Projekty. Nyní jste připraveni otevřít Výzvu k zadání testovacího pracoviště.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:24.
Datová sada použitá v tomto výukovém programu obsahuje typické informace, které společnost shromažďuje o svých zákaznících, a je k dispozici v ukázkách. Chcete-li najít datovou sadu v ukázkách a přidat ji do projektu, postupujte takto:
Získejte přístup k datové sadě zákazníků v ukázkách.
Klepněte na volbu Přidat do projektu.
Vyberte svůj projekt ze seznamu a klepněte na tlačítko Přidat.
Po přidání datové sady klepněte na volbu Zobrazit projekt.
Další informace o přidávání datových aktiv z ukázek do vašeho projektu najdete v tématu Zavedení a přístup k datům v notebooku.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje kartu Aktiva v projektu. Nyní jste připraveni vytvořit syntetický tok dat.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:43.
Synthetic Data Generator použijte k vytvoření datového toku, který generuje syntetická tabulková data na základě produkčních dat nebo vlastního datového schématu pomocí vizuálních toků a modelovacích algoritmů. Chcete-li vytvořit syntetické aktivum toku dat ve svém projektu, postupujte takto:
- Na kartě Aktiva ve svém projektu klepněte na volbu Nová úloha > Generovat syntetická tabulková data.
- Jako název zadejte
Bank customers
. - Klepněte na volbu Vytvořit.
- Na obrazovce Vítejte v produktu Synthetic Data Generator klepněte na volbu Poprvé uživatela klepněte na tlačítko Pokračovat. Tato volba poskytuje asistované zkušenosti pro sestavení datového toku.
- Zkontrolujte tyto dva případy použití:
- Efektivně využijte existující data: Generujte strukturovanou syntetickou datovou sadu založenou na vašich produkčních datech. Můžete se připojit k databázi, importovat nebo odeslat soubor, masku a generovat váš výstup před exportem.
- Vytvořit z vlastních dat: Generujte strukturovanou syntetickou datovou sadu založenou na metadatech. Můžete definovat data v rámci každého sloupce tabulky, jejich rozdělení a libovolné korelace.
- Vyberte případ použití Využijte existující data a klepněte na tlačítko Další a importujte existující data.
- Klepněte na volbu Vybrat data z projektu , abyste použili datové aktivum zákazníků, které jste přidali z ukázek.
- Vyberte volbu Datové aktivum > customers.csv.
- Klepněte na volbu Vybrat.
- Klepněte na tlačítko Další.
- V seznamu sloupců vyhledejte
creditcard_number
.- Ve sloupci Anonymita pro
CREDITCARD_NUMBER
vyberte volbu Ano , chcete-li maskovat čísla kreditních karet zákazníků. - Klepněte na tlačítko Další.
- Ve sloupci Anonymita pro
- Přijměte výchozí nastavení na stránce Volby Mime . Tyto volby generují syntetická data na základě vašich produkčních dat pomocí sady kandidátských statistických distribucí za účelem úpravy každého sloupce v datech. Klepněte na tlačítko Další.
- Do pole Název souboruzadejte
bank_customers.csv
a klepněte na tlačítko Další. - Zkontrolujte nastavení a klepněte na volbu Uložit a spustit. Nástroj Synthetic Data Generator se zobrazí s datovým tokem. Čekejte, až se běh dokončí.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje datový tok otevřený v Synthetic Data Generator. Nyní můžete prozkoumat datový tok a zobrazit výstup.
Zpět na začátek
Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 01:48.
Po dokončení spuštění můžete prozkoumat datový tok. Chcete-li přezkoumat syntetický tok dat a výsledky, postupujte takto:
Klepnutím na ikonu Paleta zavřete panel uzlu.
Poklepejte na uzel Importovat a prohlédněte si nastavení.
- Zkontrolujte vlastnosti Data . Nástroj přečte datovou sadu z projektu a naplní příslušné vlastnosti dat.
- Rozbalte sekci Typy . Nástroj četl hodnoty a sloupce v datové sadě.
- Klepněte na tlačítko Storno.
Poklepejte na uzel Anonymizovat a prohlédněte si nastavení.
- Ověřte, zda je sloupec CREDITCARD_NUMBER nastaven jako anonymizovaný.
- Rozbalte sekci Anonymizovat hodnoty . Zde můžete přizpůsobit, jak se hodnoty anonymizují.
- Klepněte na tlačítko Storno.
Poklepejte na uzel Mimický , abyste viděli nastavení.
- Zkontrolujte výchozí nastavení, chcete-li napodobovat data ve zdrojové datové sadě zákazníků.
- Klepněte na tlačítko Storno.
Poklepejte na uzel Generovat , abyste viděli nastavení.
- Prohlédněte si seznam Synthesized columns.
- Volitelné: Zkontrolujte Korelace a Rozšířené volby.
- Klepněte na tlačítko Storno.
Poklepejte na uzel Export , abyste viděli nastavení.
- Volitelné: Ve výchozím nastavení jsou exportovaná data uložena v projektu. Klepnutím na volbu Změnit cestu uložíte exportovaná data do připojení, jako je například Db2 Warehouse.
- Klepněte na tlačítko Storno.
Klepnutím na název projektu se vrátíte na kartu Aktiva .
Klepněte na bank_customers.csv , abyste viděli náhled generovaných syntetických tabulkových dat.
Zkontrolujte svůj pokrok
Následující obrázek ukazuje exportovanou, vygenerovanou syntetickou tabulkovou datovou sadu.
Zpět na začátek
Další kroky
Vyzkoušejte tyto další výukové programy pro získání více zkušeností s watsonx.ai:
Další prostředky
Prohlédněte si další videa.
Nalezení ukázkových datových sad, projektů, modelů, výzev k zadání a notebooků v ukázkách za účelem získání znalostí o zkušenostech:
Zápisníky , které můžete přidat do svého projektu, abyste mohli začít analyzovat data a sestavovat modely.
Projekty , které můžete importovat obsahující zápisníky, datové sady, výzvy k zadání a další aktiva.
Datové sady , které můžete přidat do svého projektu za účelem upřesnění, analýzy a sestavení modelů.
výzvy , které můžete použít v rámci testovacího pracoviště výzev k zadání základního modelu.
Modely nadace , které můžete použít v laboratoři výzev k zadání.
Nadřízené téma: Výukové programy Stručný úvod