0 / 0
Go back to the English version of the documentation
Stručný úvod: Generovat syntetická tabulková data
Last updated: 14. 11. 2023
Stručný úvod: Generovat syntetická tabulková data

Syntetická tabulková data můžete generovat v IBM watsonx.ai. Výhoda pro syntetická data je, že můžete obstarat data na vyžádání, pak upravit tak, aby vyhovovala vašemu případu použití, a vytvořit jej ve velkém množství. Tento výukový program vám pomůže naučit se používat nástroj grafického editoru toků, Synthetic Data Generator, ke generování syntetických tabulkových dat na základě produkčních dat nebo vlastního datového schématu pomocí vizuálních toků a modelovacích algoritmů.

Požadované služby
Watson Studio

Váš základní sled prací zahrnuje tyto úlohy:

  1. Otevřete projekt. Projekty jsou místem, kde můžete spolupracovat s ostatními na práci s daty.
  2. Přidejte data do projektu. Do připojení můžete přidat soubory CSV nebo data ze vzdáleného zdroje dat.
  3. Vytvořte a spusťte syntetický tok dat do projektu. Pomocí nástroje grafického editoru toků Synthetic Data Generator můžete generovat syntetická tabulková data na základě produkčních dat nebo vlastního datového schématu pomocí vizuálních toků a modelovacích algoritmů.
  4. Zkontrolujte tok syntetických dat a výstup.

Číst o syntetických datech

Syntetická data jsou informace, které byly generovány na počítači pro rozšíření nebo nahrazení reálných dat za účelem zlepšení modelů AI, ochrana citlivých dat a zmírnění zkreslení. Syntetická data pomáhají zmírnit mnohé z logistických, etických a osobních problémů, které jsou dodávány se studijovými modely počítačů v reálném světě-příklady.

Čtěte více o syntetických datech

Podívejte se na video o generování syntetických tabulkových dat

Zhlédnout video Chcete-li si prohlédnout kroky uvedené v tomto výukovém programu, pusťte toto video. V uživatelském rozhraní zobrazeném ve videu může dojít k mírnému rozdílu. Video je zamýšleno jako společník k písemnému výukovém programu.

Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.

Zkuste výukový program pro generování syntetických tabulkových dat

V tomto výukovém programu provedete tyto úlohy:



  • Použití obrazového videa v obraze

    Tip: Spusťte video a při procházení výukovým programem se video přesune do režimu obrazu v obraze. Zavřete video obsah pro nejlepší zážitek s obrazem v obraze. Můžete použít režim obrazu v obraze, takže můžete sledovat video po dokončení úloh v tomto výukovém programu. Klepněte na časová razítka pro každou úlohu, kterou chcete sledovat.

    Následující animovaný obrázek ukazuje, jak používat obrazový obraz v obraze a obsah:

    Jak používat obrázky v obraze a kapitoly

    Získání nápovědy pro komunitu

    Potřebujete-li pomoc s tímto výukovým programem, můžete položit otázku nebo najít odpověď v diskusním fóru komunity Cloud Pak for Data.

    Nastavení oken prohlížeče

    Pro optimální zkušenost s tímto výukovým programem otevřete Cloud Pak for Data v jednom okně prohlížeče a ponechejte tuto stránku s výukovým programem otevřenou v jiném okně prohlížeče, abyste mohli snadno přepínat mezi dvěma aplikacemi. Zvažte uspořádání dvou oken prohlížeče bok po boku tak, aby se usnadnila jeho následná práce.

    Postranní výukový program a uživatelské rozhraní

    Tip: Pokud při dokončování tohoto výukového programu v uživatelském rozhraní narazíte na prohlídku s průvodcem, klepněte na volbu Možná později.

    Zpět na začátek


  • K uložení aktiv potřebujete projekt.

    Podívejte se na video, abyste viděli, jak vytvořit projekt pískoviště a přidružit službu. Poté postupujte podle kroků a ověřte, zda máte existující projekt, nebo vytvořte projekt prostředí sandbox.

    • Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.

    1. Na domovské obrazovce watsonx přejděte do sekce Projekty . Pokud vidíte některé uvedené projekty, pak přeskočte na Úloha 2. Pokud žádné projekty nevidíte, postupujte podle níže uvedených kroků a vytvořte projekt.

    2. Klepněte na volbu Vytvořit projekt pískoviště. Po vytvoření projektu se projekt sandboxu zobrazí v sekci Projekty .

    Další informace nebo sledování videa naleznete v tématu Vytvoření projektu.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje domovskou obrazovku se sandboxem uvedeným v sekci Projekty. Nyní jste připraveni otevřít Výzvu k zadání testovacího pracoviště.

    Domovská obrazovka s vypsaným projektem pískoviště.


    Zpět na začátek


  • náhled videa výukového programu Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:24.

    Datová sada použitá v tomto výukovém programu obsahuje typické informace, které společnost shromažďuje o svých zákaznících, a je k dispozici v ukázkách. Chcete-li najít datovou sadu v ukázkách a přidat ji do projektu, postupujte takto:

    1. Získejte přístup k datové sadě zákazníků v ukázkách.

    2. Klepněte na volbu Přidat do projektu.

    3. Vyberte svůj projekt ze seznamu a klepněte na tlačítko Přidat.

    4. Po přidání datové sady klepněte na volbu Zobrazit projekt.

    Další informace o přidávání datových aktiv z ukázek do vašeho projektu najdete v tématu Zavedení a přístup k datům v notebooku.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje kartu Aktiva v projektu. Nyní jste připraveni vytvořit syntetický tok dat.

    Následující obrázek ukazuje kartu Aktiva v projektu.


    Zpět na začátek


  • náhled videa výukového programu Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 00:43.

    Synthetic Data Generator použijte k vytvoření datového toku, který generuje syntetická tabulková data na základě produkčních dat nebo vlastního datového schématu pomocí vizuálních toků a modelovacích algoritmů. Chcete-li vytvořit syntetické aktivum toku dat ve svém projektu, postupujte takto:

    1. Na kartě Aktiva ve svém projektu klepněte na volbu Nová úloha > Generovat syntetická tabulková data.
    2. Jako název zadejte Bank customers.
    3. Klepněte na volbu Vytvořit.
    4. Na obrazovce Vítejte v produktu Synthetic Data Generator klepněte na volbu Poprvé uživatela klepněte na tlačítko Pokračovat. Tato volba poskytuje asistované zkušenosti pro sestavení datového toku.
    5. Zkontrolujte tyto dva případy použití:
      • Efektivně využijte existující data: Generujte strukturovanou syntetickou datovou sadu založenou na vašich produkčních datech. Můžete se připojit k databázi, importovat nebo odeslat soubor, masku a generovat váš výstup před exportem.
      • Vytvořit z vlastních dat: Generujte strukturovanou syntetickou datovou sadu založenou na metadatech. Můžete definovat data v rámci každého sloupce tabulky, jejich rozdělení a libovolné korelace.
    6. Vyberte případ použití Využijte existující data a klepněte na tlačítko Další a importujte existující data.
    7. Klepněte na volbu Vybrat data z projektu , abyste použili datové aktivum zákazníků, které jste přidali z ukázek.
      1. Vyberte volbu Datové aktivum > customers.csv.
      2. Klepněte na volbu Vybrat.
      3. Klepněte na tlačítko Další.
    8. V seznamu sloupců vyhledejte creditcard_number.
      1. Ve sloupci Anonymita pro CREDITCARD_NUMBERvyberte volbu Ano , chcete-li maskovat čísla kreditních karet zákazníků.
      2. Klepněte na tlačítko Další.
    9. Přijměte výchozí nastavení na stránce Volby Mime . Tyto volby generují syntetická data na základě vašich produkčních dat pomocí sady kandidátských statistických distribucí za účelem úpravy každého sloupce v datech. Klepněte na tlačítko Další.
    10. Do pole Název souboruzadejte bank_customers.csva klepněte na tlačítko Další.
    11. Zkontrolujte nastavení a klepněte na volbu Uložit a spustit. Nástroj Synthetic Data Generator se zobrazí s datovým tokem. Čekejte, až se běh dokončí.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje datový tok otevřený v Synthetic Data Generator. Nyní můžete prozkoumat datový tok a zobrazit výstup.

    Následující obrázek ukazuje datový tok otevřený v Synthetic Data Generator.


    Zpět na začátek


  • náhled videa výukového programu Chcete-li zobrazit náhled této úlohy, podívejte se na video začínající na 01:48.

    Po dokončení spuštění můžete prozkoumat datový tok. Chcete-li přezkoumat syntetický tok dat a výsledky, postupujte takto:

    1. Klepnutím na ikonu Paleta Ikona palety zavřete panel uzlu.

    2. Poklepejte na uzel Importovat a prohlédněte si nastavení.

      1. Zkontrolujte vlastnosti Data . Nástroj přečte datovou sadu z projektu a naplní příslušné vlastnosti dat.
      2. Rozbalte sekci Typy . Nástroj četl hodnoty a sloupce v datové sadě.
      3. Klepněte na tlačítko Storno.
    3. Poklepejte na uzel Anonymizovat a prohlédněte si nastavení.

      1. Ověřte, zda je sloupec CREDITCARD_NUMBER nastaven jako anonymizovaný.
      2. Rozbalte sekci Anonymizovat hodnoty . Zde můžete přizpůsobit, jak se hodnoty anonymizují.
      3. Klepněte na tlačítko Storno.
    4. Poklepejte na uzel Mimický , abyste viděli nastavení.

      1. Zkontrolujte výchozí nastavení, chcete-li napodobovat data ve zdrojové datové sadě zákazníků.
      2. Klepněte na tlačítko Storno.
    5. Poklepejte na uzel Generovat , abyste viděli nastavení.

      1. Prohlédněte si seznam Synthesized columns.
      2. Volitelné: Zkontrolujte Korelace a Rozšířené volby.
      3. Klepněte na tlačítko Storno.
    6. Poklepejte na uzel Export , abyste viděli nastavení.

      1. Volitelné: Ve výchozím nastavení jsou exportovaná data uložena v projektu. Klepnutím na volbu Změnit cestu uložíte exportovaná data do připojení, jako je například Db2 Warehouse.
      2. Klepněte na tlačítko Storno.
    7. Klepnutím na název projektu se vrátíte na kartu Aktiva .

      Navigační cesta projektu

    8. Klepněte na bank_customers.csv , abyste viděli náhled generovaných syntetických tabulkových dat.

    Ikona kontrolního bodu Zkontrolujte svůj pokrok

    Následující obrázek ukazuje exportovanou, vygenerovanou syntetickou tabulkovou datovou sadu.

    Následující obrázek ukazuje exportovanou, vygenerovanou syntetickou tabulkovou datovou sadu.


    Zpět na začátek

Další kroky

Vyzkoušejte tyto další výukové programy pro získání více zkušeností s watsonx.ai:

Další prostředky

  • Prohlédněte si další videa.

  • Nalezení ukázkových datových sad, projektů, modelů, výzev k zadání a notebooků v ukázkách za účelem získání znalostí o zkušenostech:

    Ikona zápisníku Zápisníky , které můžete přidat do svého projektu, abyste mohli začít analyzovat data a sestavovat modely.

    Ikona projektu Projekty , které můžete importovat obsahující zápisníky, datové sady, výzvy k zadání a další aktiva.

    Ikona datové sady Datové sady , které můžete přidat do svého projektu za účelem upřesnění, analýzy a sestavení modelů.

    Ikona výzvy výzvy , které můžete použít v rámci testovacího pracoviště výzev k zadání základního modelu.

    Ikona modelu Modely nadace , které můžete použít v laboratoři výzev k zadání.

  • Přehled watsonx

Nadřízené téma: Výukové programy Stručný úvod

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more