Můžete použít data, která jsou uložena jako soubory na zdrojích dat IBM® Cloud Object Storage, Amazon S3nebo Ceph ® k vytvoření virtuálních tabulek. Vytvořte segment nebo zkombinujte data z jednoho nebo více souborů a vytvořte virtuální tabulku.
O této úloze
Podívejte se na následující video pro přehled virtualizovaných souborů v produktu Cloud Object Storage v produktu Watson Query.
Toto video poskytuje vizuální metodu jako alternativu k následujícím psaným krokům v této dokumentaci.
Postup
- V navigační nabídce, klepněte na volbu .
Nabídka služby se standardně otevře na stránce Zdroje dat .
- V nabídce služeb: klepněte na volbu a poté klepněte na kartu Soubory .
Zobrazí se seznam dostupných zdrojů dat. Zobrazená aktiva můžete zúžit pomocí dostupných filtrů.
Pokud jste při nastavení připojení ke zdroji dat zadali název sektoru, klepněte na volbu a rozbalte podrobnosti o připojení úložiště objektů a prohlédněte si informace o Typ služby a Sektor . Pokud jste při nastavení připojení ke zdroji dat neuvedli název sektoru, můžete použít vstupní pole Sektor k vyhledání specifického sektoru v koncovém bodu.
Pokud se seznam zdrojů dat neobjeví, klepněte na tlačítko Aktualizovat.
- Vyberte koncový bod úložiště objektů, ve kterém chcete procházet soubory a cesty k souborům.
Pro produkt Cloud Object Storageje koncový bod adresa URL pro úložiště objektů.
Zobrazí se seznam cest k souborům nebo sektorů na koncovém bodu. Můžete procházet strukturou cesty k souboru nebo můžete klepnout na tlačítko
a prohlédnout si podrobnosti o obsahu prvního souboru v cestě k souboru.
Nemůžete přidat sektor do vašeho nákupního košíku. Chcete-li do svého nákupního košíku přidat cestu k souboru, musíte vybrat cestu k souboru, abyste zobrazili náhled souborů v cestě, a pak klepněte na Přidat do nákupního košíku. Nelze vybrat soubor na úrovni sektoru, je třeba přidat soubor do cesty k souboru v sektoru.
- Vyberte cestu k souboru nebo k souboru, který chcete virtualizovat, a klepněte na volbu Přidat do nákupního košíku.
Důležité:
- Jediný soubor v cestě k souboru, který obsahuje více souborů, nemůžete virtualizovat. Adresa URL se interpretuje jako nadřízená cesta, kde je soubor umístěn, a celá cesta k souboru je virtualizována. Chcete-li virtualizovat jeden soubor, můžete jej přesunout do samostatného adresáře. Samostatný adresář nesmí být podadresářem žádného jiného adresáře, který je, nebo bude virtualizovaný.
- Soubory, které chcete virtualizovat, musí být v cestě k souboru a ne na stejné úrovni jako sektor. Například nemůžete virtualizovat soubor s3a://mynewbigsqlbucket/mydata.csv; musíte vložit mydata.csv do cesty k souboru a virtualizovat s3a://mynewbigsqlbucket/fi1epath1/mydata.csv , protože proces virtualizace nemůže vytvořit externí tabulku, a to pouze pomocí názvu sektoru bez cesty.
- Klepnutím na tlačítko Zobrazit nákupní košík si můžete zobrazit náhled výběru dat souboru jako virtuálního souboru.
V tomto okně můžete upravit názvy schémat, zobrazit náhled souborů, které se podílejí na sloučené tabulce, nebo odebrat výběr z vašeho nákupního košíku.
Máte-li nainstalovaný produkt Watson™ Knowledge Catalog , můžete publikovat virtuální tabulku do katalogu. Další informace naleznete v tématu Publikování virtuálních dat do katalogu v produktu Watson Query.
- Doporučeno: Aktualizujte typ rozdělených sloupců z ŘETĚZEC na něco vhodnějšího. Ručně zkontrolujte a zadejte vhodné typy pro rozdělovací sloupce pro nejlepší výkon.
- Volitelné: Klepněte na tlačítko a vyberte volbu Upravit sloupce.
Pomocí rozevírací nabídky můžete upravit libovolný název sloupce, který není označen jako
Rozdělovací sloupec a měnit typy sloupců. Jste-li spokojeni s úpravami, klepněte na tlačítko
Použít. Aktualizované názvy sloupců se zobrazí po virtualizaci tabulky.
Pozn.:
- Názvy japonských sloupců se nezobrazují správně
- Když virtualizujete soubory JSON s japonskými daty v produktu IBM Cloud Object Storage, mohou být názvy japonských sloupců přeloženy na hexadecimální hodnoty. K vyřešení tohoto problému lze použít volbu
allownonalphanumeric
. Volba allownonalphanumeric
je však standardně zakázaná a vy se musíte obrátit na podporuIBM® Cloud , abyste mohli otevřít tiket, aby byla volba povolena.
- Vyberte příslušnou volbu, chcete-li přiřadit virtuální tabulku, která se má vytvořit ze souborů dat:
Přiřadit k |
Kdy použít tuto volbu |
Projekt |
Vyberte volbu Projekt , pokud jste vytvořili virtuální tabulku pro použití ve specifickém projektu. Poté zvolte příslušný projekt. Tabulka se také zobrazí v části Virtualizovaná data. |
Virtualizovaná data |
Vyberte volbu Virtualizovaná data , pokud nebyla tabulka vytvořena pro použití ve specifickém projektu. Toto nastavení je výchozí, pokud neexistují žádné projekty. |
- Chcete-li publikovat do vybraného katalogu, vyberte volbu Publikovat do katalogu .
V rozevírací nabídce se zobrazí seznam dostupných katalogů. Každý katalog je označen jako
Regulováno nebo
Neregulováno.
Poznámka: Musíte mít alespoň jeden katalog v produktu
Watson Knowledge Catalog.
Musíte mít oprávnění k publikování do katalogu. Administrátor může povolit, zda jsou všechny virtuální objekty publikovány do vybraného regulovaného katalogu, což zabrání uživateli v publikování do určeného katalogu.
- Určete schéma v poli Schéma .
Schéma můžete také vytvořit pomocí následujících kroků.
- Máte-li roli Watson Query Engineer nebo User , ponechejte pole Schéma jako výchozí pro vytvoření schématu s vaším ID uživatele.
- Máte-li roli Watson Query Manager , ponechejte pole Schéma jako výchozí pro vytvoření schématu s ID uživatele nebo zadejte nový název schématu do pole Schéma .
- Chcete-li dokončit proces, klepněte na volbu Virtualizovat .
Když se zobrazí stavové okno, můžete si vybrat zobrazení vašich virtualizovaných dat nebo virtualizaci více dat.