Můžete sloučit tabulky z více zdrojů dat do jedné virtuální tabulky, která vytvoří unifikovanou definici, která obsahuje sloupce a data ze všech zúčastněných zdrojů dat. Tyto tabulky jsou označovány jako seskupené tabulky.
Segmentace je svislá (buď podmnožina, nebo nadmnožina sloupců založená na výběru vybraných sloupců). Dotazy na výslednou virtuální tabulku můžete spustit stejným způsobem jako dotazy na některou ze základních tabulek.
Tabulky lze seskupovat do jedné virtualizované tabulky, pokud jsou názvy tabulek, které jsou interpretovány řidičem, stejné (přesná shoda, rozlišování velkých a malých písmen). Sémantika seskupení tabulek považuje sloupce se stejným názvem (bez rozlišení malých a velkých písmen) k porovnání. Podpora datového typu se řídí pravidly priority.
Musíte se ujistit, že seskupování tabulek je logické, zejména pokud jde o zacházení s datovými typy seskupených tabulek. V některých případech mohou mít odpovídající sloupce různé datové typy. Pravidla se používají k určení výsledných datových typů seskupených tabulek. Další informace naleznete v tématu Pravidla pro datové typy výsledků.
Chcete-li zabránit neočekávaným výsledkům, musíte být opatrní, když seskupujete tabulky do jedné virtualizované tabulky. Při vytváření seskupených tabulek lze zvážit následující doporučení, ačkoli nic není omezeno.
- Ujistěte se, že sloupce se stejným názvem ze všech tabulek mají kompatibilní datové typy a kompatibilní obchodní využití. Doména dat ve všech tabulkách musí být kompatibilní.
- Seskupte tabulky ze stejného typu zdroje dat, abyste zajistili konzistentní sémantiku dat.
- Když seskupujete tabulky z různých typů zdrojů dat, zajistěte konzistentní sémantiku dat.
- Ujistěte se, že všechny tabulky ve skupině mají nejvíce sloupců se stejnými názvy. Ujistěte se, že odpovídající sloupce mají kompatibilní datové typy.
- Nezahrnujte sloupce, které jsou definovány na komplexních typech.
Poznámka: Některé zdroje dat, jako např. Hive, používají pro názvy tabulek standardně malá písmena. Tyto tabulky nemohou být seskupeny s tabulkami z jiných zdrojů dat, které mají velká písmena jako výchozí, pokud nejsou použity identifikátory s oddělovači k zajištění přesné shody názvů tabulek.
O této úloze
Tyto kroky popisují, jak virtualizovat data bez obchodních termínů. Chcete-li řídit vaše virtuální data, prostudujte si téma Regulace virtuálních dat v produktu Watson Query.
Postup
- V navigační nabídce, klepněte na volbu .
Nabídka služby se standardně otevře na stránce Zdroje dat .
- V nabídce služeb: klepněte na volbu a klepněte na kartu Tabulky .
Zobrazí se seznam dostupných tabulek ze zdrojů dat. Zobrazená aktiva můžete zúžit pomocí dostupných filtrů. Kromě toho můžete vyhledávat tabulky podle názvu, schématu, sloupce nebo obchodního termínu. Produkt Watson Query může automaticky navrhovat odpovídající tabulky, které lze zkombinovat do jedné virtuální tabulky.
- Chcete-li sloučit tabulky do jednoho virtuálního objektu, klepněte na volbu Nastavení a v nabídce nastavení vyberte volbu Seskupit tabulky se shodnými názvy .
Na obrazovce se zobrazí navrhované seskupení tabulek a v kroku Revize můžete dokončovat zúčastněné zdrojové tabulky.
Seznam dostupných tabulek obsahuje tabulky, v nichž není uděleno oprávnění ke čtení (nečitelné tabulky).
- Pokud vytváříte virtuální tabulku, která obsahuje nečitelnou tabulku, vyberte jednu z následujících možností, abyste virtuální tabulku mohli dotazovat.
- Volba 1 Klepněte na volbu Upravit seskupené tabulky v nabídce akcí tabulky a odeberte nečitelnou tabulku ze skupiny, kterou virtualizujete.
- Volba 2 Ujistěte se, že uživatel, který je přiřazen k připojení ke zdroji dat, může přistupovat k nečitelné tabulce. Tento krok může nastat před nebo za virtualizovaným tabulkou.
- Volba 3 Vytvoření připojení ke zdroji dat v produktu Watson Query pro přístup ke stejnému zdroji dat s pověřeními pro samostatného uživatele, který má přístup pro čtení k tabulce. V důsledku toho se při výběru volby Skupina tabulek s identickými názvy zobrazí seznam dalších instancí tabulky. Před virtualizací tabulek musíte i nadále ručně odebrat nečitelné tabulky zjištěné v rámci omezeného připojení uživatele (jak je popsáno v části 1).
- Vyberte tabulku, kterou chcete virtualizovat, a klepněte na volbu Přidat do nákupního košíku.
- Klepnutím na tlačítko Zobrazit nákupní košík zobrazíte váš výběr. V tomto okně můžete také upravit názvy tabulek a schémat nebo odebrat výběr z vašeho nákupního košíku.
- Vyberte odpovídající akci pro přiřazení virtualizované tabulky.
Přiřadit k |
Kdy použít tuto volbu |
Projekt |
Vyberte volbu Projekt , pokud jste vytvořili virtuální tabulku pro použití ve specifickém projektu. Poté zvolte příslušný projekt. Tabulka se také zobrazí v části Virtualizovaná data. |
Virtualizovaná data |
Vyberte volbu Virtualizovaná data , pokud nebyla tabulka vytvořena pro použití ve specifickém projektu. Toto nastavení je výchozí, pokud neexistují žádné projekty. |
- Chcete-li publikovat do vybraného katalogu, vyberte volbu Publikovat do katalogu .
V rozevírací nabídce se zobrazí seznam dostupných katalogů. Každý katalog je označen jako
Regulováno nebo
Neregulováno.
Poznámka: Musíte mít alespoň jeden katalog v produktu
Watson Knowledge Catalog.
Musíte mít oprávnění k publikování do katalogu. Administrátor může povolit, zda jsou všechny virtuální objekty publikovány do vybraného regulovaného katalogu, což zabrání uživateli v publikování do určeného katalogu.
- Určete schéma v poli Schéma .
Schéma můžete také vytvořit pomocí následujících kroků.
- Máte-li roli Watson Query Engineer nebo User , ponechejte pole Schéma jako výchozí pro vytvoření schématu s vaším ID uživatele.
- Máte-li roli Watson Query Manager , ponechejte pole Schéma jako výchozí pro vytvoření schématu s ID uživatele nebo zadejte nový název schématu do pole Schéma .
- Chcete-li dokončit proces, klepněte na volbu Virtualizovat .
Když se zobrazí stavové okno, můžete si vybrat zobrazení vašich virtualizovaných dat nebo virtualizaci více dat.
- Chcete-li zobrazit nově vytvořené tabulky, klepněte na volbu Zobrazit virtualizovaná data .