0 / 0
Go back to the English version of the documentation
Vytvoření virtualizované tabulky ze souborů v produktu Cloud Object Storage v produktu Watson Query
Last updated: 15. 5. 2023
Vytvoření virtualizované tabulky ze souborů v produktu Cloud Object Storage v produktu Watson Query

Můžete použít data, která jsou uložena jako soubory na zdrojích dat IBM® Cloud Object Storage, Amazon S3nebo Ceph ® k vytvoření virtuálních tabulek. Vytvořte segment nebo zkombinujte data z jednoho nebo více souborů a vytvořte virtuální tabulku.

Než začnete

Chcete-li přistupovat k datům v úložišti objektů cloudu, musíte vytvořit připojení ke zdroji dat, kde jsou soubory umístěny, jako např. Amazon S3, Cephnebo IBM Cloud Object Storage. Další informace o úložných zdrojích dat objektů naleznete v tématu Zdroje dat v úložišti objektů v produktu Watson Query.

O této úloze

Podívejte se na následující video pro přehled virtualizovaných souborů v produktu Cloud Object Storage v produktu Watson Query.

Toto video poskytuje vizuální metodu jako alternativu k následujícím psaným krokům v této dokumentaci.

Postup

  1. V navigační nabídce, klepněte na volbu Data > Data virtualization.
    Nabídka služby se standardně otevře na stránce Zdroje dat .
  2. V nabídce služeb: klepněte na volbu Virtualizace > Virtualizace a poté klepněte na kartu Soubory .
    Zobrazí se seznam dostupných zdrojů dat. Zobrazená aktiva můžete zúžit pomocí dostupných filtrů.

    Pokud jste při nastavení připojení ke zdroji dat zadali název sektoru, klepněte na volbu Ikona se stříškou dolů a rozbalte podrobnosti o připojení úložiště objektů a prohlédněte si informace o Typ služby a Sektor . Pokud jste při nastavení připojení ke zdroji dat neuvedli název sektoru, můžete použít vstupní pole Sektor k vyhledání specifického sektoru v koncovém bodu.

    Pokud se seznam zdrojů dat neobjeví, klepněte na tlačítko AktualizovatIkona obnovení.

  3. Vyberte koncový bod úložiště objektů, ve kterém chcete procházet soubory a cesty k souborům.
    Pro produkt Cloud Object Storageje koncový bod adresa URL pro úložiště objektů.
    Zobrazí se seznam cest k souborům nebo sektorů na koncovém bodu. Můžete procházet strukturou cesty k souboru nebo můžete klepnout na tlačítko Ikona pohledu a prohlédnout si podrobnosti o obsahu prvního souboru v cestě k souboru.

    Nemůžete přidat sektor do vašeho nákupního košíku. Chcete-li do svého nákupního košíku přidat cestu k souboru, musíte vybrat cestu k souboru, abyste zobrazili náhled souborů v cestě, a pak klepněte na Přidat do nákupního košíku. Nelze vybrat soubor na úrovni sektoru, je třeba přidat soubor do cesty k souboru v sektoru.

  4. Vyberte cestu k souboru nebo k souboru, který chcete virtualizovat, a klepněte na volbu Přidat do nákupního košíku.
    Důležité:
    • Jediný soubor v cestě k souboru, který obsahuje více souborů, nemůžete virtualizovat. Adresa URL se interpretuje jako nadřízená cesta, kde je soubor umístěn, a celá cesta k souboru je virtualizována. Chcete-li virtualizovat jeden soubor, můžete jej přesunout do samostatného adresáře. Samostatný adresář nesmí být podadresářem žádného jiného adresáře, který je, nebo bude virtualizovaný.
    • Soubory, které chcete virtualizovat, musí být v cestě k souboru a ne na stejné úrovni jako sektor. Například nemůžete virtualizovat soubor s3a://mynewbigsqlbucket/mydata.csv; musíte vložit mydata.csv do cesty k souboru a virtualizovat s3a://mynewbigsqlbucket/fi1epath1/mydata.csv , protože proces virtualizace nemůže vytvořit externí tabulku, a to pouze pomocí názvu sektoru bez cesty.
  5. Klepnutím na tlačítko Zobrazit nákupní košík si můžete zobrazit náhled výběru dat souboru jako virtuálního souboru.
    V tomto okně můžete upravit názvy schémat, zobrazit náhled souborů, které se podílejí na sloučené tabulce, nebo odebrat výběr z vašeho nákupního košíku.

    Máte-li nainstalovaný produkt Watson™ Knowledge Catalog , můžete publikovat virtuální tabulku do katalogu. Další informace naleznete v tématu Publikování virtuálních dat do katalogu v produktu Watson Query.

  6. Doporučeno: Aktualizujte typ rozdělených sloupců z ŘETĚZEC na něco vhodnějšího. Ručně zkontrolujte a zadejte vhodné typy pro rozdělovací sloupce pro nejlepší výkon.
  7. Volitelné: Klepněte na tlačítko Ikona nabídky přetečení a vyberte volbu Upravit sloupce.
    Pomocí rozevírací nabídky můžete upravit libovolný název sloupce, který není označen jako Rozdělovací sloupec a měnit typy sloupců. Jste-li spokojeni s úpravami, klepněte na tlačítko Použít. Aktualizované názvy sloupců se zobrazí po virtualizaci tabulky.
    Pozn.:
    Názvy japonských sloupců se nezobrazují správně
    Když virtualizujete soubory JSON s japonskými daty v produktu IBM Cloud Object Storage, mohou být názvy japonských sloupců přeloženy na hexadecimální hodnoty. K vyřešení tohoto problému lze použít volbu allownonalphanumeric . Volba allownonalphanumeric je však standardně zakázaná a vy se musíte obrátit na podporuIBM® Cloud , abyste mohli otevřít tiket, aby byla volba povolena.
  8. Vyberte příslušnou volbu, chcete-li přiřadit virtuální tabulku, která se má vytvořit ze souborů dat:
    Přiřadit k Kdy použít tuto volbu
    Projekt Vyberte volbu Projekt , pokud jste vytvořili virtuální tabulku pro použití ve specifickém projektu. Poté zvolte příslušný projekt. Tabulka se také zobrazí v části Virtualizovaná data.
    Virtualizovaná data Vyberte volbu Virtualizovaná data , pokud nebyla tabulka vytvořena pro použití ve specifickém projektu. Toto nastavení je výchozí, pokud neexistují žádné projekty.
  9. Chcete-li publikovat do vybraného katalogu, vyberte volbu Publikovat do katalogu .
    V rozevírací nabídce se zobrazí seznam dostupných katalogů. Každý katalog je označen jako Regulováno nebo Neregulováno.
    Poznámka: Musíte mít alespoň jeden katalog v produktu Watson Knowledge Catalog.

    Musíte mít oprávnění k publikování do katalogu. Administrátor může povolit, zda jsou všechny virtuální objekty publikovány do vybraného regulovaného katalogu, což zabrání uživateli v publikování do určeného katalogu.

  10. Určete schéma v poli Schéma .
    Schéma můžete také vytvořit pomocí následujících kroků.
    • Máte-li roli Watson Query Engineer nebo User , ponechejte pole Schéma jako výchozí pro vytvoření schématu s vaším ID uživatele.
    • Máte-li roli Watson Query Manager , ponechejte pole Schéma jako výchozí pro vytvoření schématu s ID uživatele nebo zadejte nový název schématu do pole Schéma .
    Další informace naleznete v tématu Vytvoření schémat pro virtuální objekty.
  11. Chcete-li dokončit proces, klepněte na volbu Virtualizovat .
    Když se zobrazí stavové okno, můžete si vybrat zobrazení vašich virtualizovaných dat nebo virtualizaci více dat.

Další kroky

  • Zobrazení struktury tabulky a metadat.
  • Upravte názvy sloupců a typy vašich aktiv úložiště objektů tak, abyste mohli připravit přesné údaje pro virtualizaci.
  • Spravovat přístup k tabulce.
  • Shromážděte statistiky pro vaši virtualizovanou tabulku, abyste optimalizovali výkon dotazů. Další informace naleznete v tématu Shromažďování statistiky v produktu Watson Query.
  • Volitelně můžete na stránce Virtualizovaná data publikovat svůj virtuální objekt do katalogu. Další informace naleznete v tématu Publikování virtuálních dat do katalogu v produktu Watson Query.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more