Translation not up to date
Každý zdroj dat nebo aktivum musí být namapován a publikován do datového modelu před tím, než může být použit v rámci funkcí IBM Match 360 , jako např. shoda.
- Požadovaná oprávnění
- Chcete-li přidat, mapovat a publikovat data aktiv do hlavní datové instance, musíte být členem skupiny uživatelů DataEngineer pro službu IBM Match 360 .
- Pokud pracujete s regulovaným katalogem, můžete pouze zobrazit nebo přidat aktiva katalogu, z nichž jste vlastníkem datového aktiva.
Produkt IBM Match 360 zahrnuje výkonnou funkci automatického mapování, která odstraňuje potřebu datových inženýrů ručně mapovat každý sloupec dat do modelu. Funkce automatického mapování zjišťuje, analyzuje a kategorizuje každý sloupec dat na odpovídající atributy nebo pole v datovém modelu. Než budete moci spustit automatické mapování, musíte profilovat svá data. Profilování analyzuje a klasifikuje vaše data, aby bylo možné povolit proces automatického mapování.
Profilování a automatické mapování je podporováno pouze pro typy záznamů osob a organizací. Pro jiné typy záznamů ručně namapujte sloupce na datový model.
V tomto tématu:
- Přidání dat záznamu z prostého datového souboru
- Přidání dat nebo zdrojů prostřednictvím projektu
- Mapování vašich dat na datový model
- Přidání dat o vztazích z prostého datového souboru
- Publikování ukázkových dat
Přidání dat záznamu z prostého datového souboru
Chcete-li přidat data záznamu do produktu IBM Match 360 z datového souboru CSV nebo TSV, postupujte takto:
V navigační nabídce klepněte na volbu Nastavení dat a otevřete obrazovku pro nastavení dat. Klepněte na Start with data assets nebo vyberte kartu Aktiva .
Klepněte na ikonu Odeslat aktivum do projektu na řádku s akcemi.
Na panelu Data, který se otevře, zvolte, zda chcete přidat data odesláním, z projektu nebo z katalogu. Chcete-li odeslat datový soubor, vyberte volbu Načíst.
Na svém lokálním počítači vyberte prostý datový soubor ve formátu CSV nebo TSV a přetáhněte jej do panelu dat. Jakmile soubor dokončí nahrávání, přidá se do souhrnného seznamu vašich aktiv.
Zkontrolujte podrobnosti o nově přidaném aktivu. Pokud vaše aktivum nemá žádné informace ve sloupci Datový typ aktiva , musíte definovat typ záznamu. Datový typ aktiva poskytuje informace o typu dat, která každé aktivum obsahuje. Je důležité přiřadit typ záznamu ke každému aktivu, takže produkt IBM Match 360 může najít část datového modelu, která nejlépe odpovídá datům.
a. Podržte ukazatel myši nad řádkem vašeho aktiva v souhrnném seznamu aktiv a klepněte na třídokovou nabídku přetečení. Případně, chcete-li upravit vlastnosti aktiva pro více než jedno aktivum najednou, označte zaškrtávací políčko vedle více aktiv v souhrnném seznamu aktiv.
b. Klepněte na volbu Nastavit vlastnosti aktiva.
c. Vyberte Záznamy ze seznamu Kategorie dat aktiva .
d. Vyberte správný typ entity ze seznamu Datový typ aktiva a klepněte na tlačítko Uložit.
Pokud odpovídající typ entity není uveden v seznamu datových typů aktiva, možná budete muset přizpůsobit svůj datový model. Další informace naleznete v tématu Úprava datového modelu.
Další krok: Namapujte vaše data na datový model
Přidání dat nebo zdrojů prostřednictvím projektu
Prostřednictvím projektu můžete přidat datová aktiva, zdroje nebo připojení k produktu IBM Match 360 .
IBM Match 360 můžete použít jako připojený zdroj dat nebo cíl. Informace o nastavení a použití připojení IBM Match 360 najdete v tématu IBM Match 360 připojení.
Všechny soubory datových aktiv, které chcete načíst do produktu IBM Match 360 , musí zahrnovat příponu souboru podporovaného typu, jako například .csv
nebo .tsv
. Tento požadavek zahrnuje aktiva, která jsou již ve vašem projektu. Pokud název aktiva ve vašem projektu neobsahuje podporovanou příponu souboru, zobrazí se šedě, když se pokusíte přidat. Chcete-li upravit název aktiva ve svém projektu, přejděte na kartu Aktiva vašeho projektu, vyberte vaše aktivum a poté upravte název na panelu O tomto aktivu .
Podívejte se na toto video, abyste viděli, jak vytvořit připojení a jak přidat připojená data do projektu.
Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.
Transkripce videa Čas transcript 00.00 Toto video ukazuje, jak nastavit připojení ke zdroji dat a přidat připojená data k projektu Watson Studio . 00:08 Máte-li data uložená ve zdroji dat, můžete nastavit připojení k tomuto zdroji dat z libovolného projektu. 00:16 Odsud můžete do projektu přidat různé prvky. 00:20 V tomto případě chcete přidat připojení. 00:24 Můžete vytvořit nové připojení ke službě IBM , jako např. IBM Db2 a Cloud Object Storage, nebo ke službě od třetích stran, jako jsou Amazon, Microsoft nebo Apache. 00:39 A můžete filtrovat seznam na základě kompatibilních služeb. 00:45 Můžete také přidat připojení, které bylo vytvořeno na úrovni platformy, které lze použít napříč projekty a katalogy. 00:54 Nebo můžete vytvořit připojení k jednomu ze zajišťovaných služeb IBM Cloud . 00:59 V tomto případě vyberte zajištěnou službu IBM Cloud pro produkt Db2 Warehouse on Cloud. 01:08 Nejsou-li pověření předvyplněna, můžete získat pověření pro instanci ze stránky spuštění služby IBM Cloud . 01:17 Nejprve otestujte připojení a potom vytvořte připojení. 01:25 Nové připojení se nyní zobrazí v seznamu datových aktiv. 01:30 Dále přidejte do tohoto projektu připojená datová aktiva. 01:37 Vyberte zdroj-v tomto případě se právě vytvořil připojení Db2 Warehouse on Cloud . 01:43 Poté vyberte schéma a tabulku. 01:50 Můžete vidět, že tento odkaz přidá odkaz na data v rámci tohoto připojení a zahrne jej do cílového projektu. 01:58 Zadejte název a popis a klepněte na tlačítko "Vytvořit". 02:06 Data se nyní zobrazí v seznamu datových aktiv. 02:09 Chcete-li získat náhled, otevřete datovou sadu a odtud můžete přímo přejít přímo k upřesnění dat. 02:17 Další videa naleznete v dokumentaci k produktu Cloud Pak for Data as a Service .
Další informace o přidávání dat přímo do projektu naleznete v tématu Přidání dat do projektu.
Po přidání dat ji musíte namapovat na datový model IBM Match 360 . Podrobnosti najdete v tématu Mapování dat na datový model.
Mapování vašich dat na datový model
Chcete-li namapovat datové aktivum na datový model IBM Match 360 , postupujte takto:
Na obrazovce Nastavení dat klepněte na kartu Mapování .
Ze seznamu aktiv vyberte datové aktivum, které chcete mapovat na systém. Data z aktiva se zobrazí v tabulkovém formátu s počtem řádků a sloupců. Každý sloupec představuje atribut, který musí být mapován na odpovídající typ atributu v datovém modelu. Když poprvé otevřete zdroj dat nebo aktivum, každý sloupec je označen značkou Nemapováno .
Tip: Každý sloupec můžete ručně mapovat, pokud si vyberete, ale můžete výrazně urychlit proces mapování tím, že využijete funkci automatického mapování.Chcete-li povolit automatické mapování pro tento zdroj nebo aktivum, musíte nejprve profilovat data. Klepněte na volbu Profil. Profilování analyzuje a klasifikuje vaše data, aby bylo možné povolit proces automatického mapování. Profilování může trvat delší dobu, takže se spustí na pozadí, takže budete moci pokračovat v práci. Možná budete chtít spustit přezkoumání a ruční mapování některých sloupců.
Automatické mapování nebude nikdy přepsat žádné ruční mapování, které jste provedli.
Po dokončení profilování klepněte na volbu Automap. Produkt IBM Match 360 with Watson analyzuje vaše data a automaticky mapuje co možná nejvíce sloupců do datového modelu. I když nemůže mapovat specifický sloupec, funkce automap může navrhnout některé z nejpravděpodobnějších výběrů mapování.
Zkontrolujte výsledky automatického mapování. Pokud jsou některá mapování nesprávná, nebo pokud sloupec zůstává nemapovaný, pak je ručně namapujte správně. Případně, pokud specifický sloupec není povinný, můžete jej vyloučit ze svého datového načtení IBM Match 360 with Watson .
Chcete-li ručně namapovat sloupec, vyberte jej, pak použijte panel Cíle mapování k vyhledání a výběru odpovídajícího atributu nebo pole z datového modelu. Klepněte na volbu Mapovat a uložit do datového modelu. Pokud příslušný atribut nebo pole v datovém modelu neexistuje, můžete jej vytvořit na panelu Cíle mapování . Klepnutím na tlačítko + vytvoříte a poskytnete podrobnosti o novém poli nebo atributu.
Pokud se rozhodnete vytvořit Jednoduchý atribut místo přiřazení existujícího typu atributu, pak se nový jednoduchý atribut přidá přímo do typu záznamu na kartě Modelování . Není kategorizován pod Typy atributů.
Posouvejte vodorovně přes sloupce, abyste se ujistili, že je každý sloupec ve zdroji dat nebo aktivum mapován. Pokud nejsou některé sloupce mapovány, automaticky přiřazeny nebo explicitně vyloučeny z mapování, zůstane aktivum dat ve stavu Mapování probíhá .
Chcete-li vyloučit sloupec z mapování, vyberte sloupec a poté vyberte volbu Vyloučit tento sloupec z mapování.
Když dokončíte mapování zdroje dat, jste připraveni publikovat data do systému.
- Pokud je váš datový model nový nebo změněný, publikujte svůj model nejprve klepnutím na ikonu Publikovat model v řádku s akcemi. Čekejte, až se dokončí publikační úloha.
- Chcete-li publikovat vaše data, klepněte na ikonu Publikovat data na řádku s akcemi. Čekejte, až se dokončí publikační úloha.
Vraťte se na stránku přehledu konfigurace výběrem volby Přehled konfigurace z nabídky navigace.
Na stránce s přehledem konfigurace potvrďte, že máte alespoň jeden zdroj dat nebo aktivum, které je přidáno a mapováno.
Přidání dat relací z prostého datového souboru
Než budete moci načíst datové aktivum relace do produktu IBM Match 360, musíte nejprve definovat odpovídající typ vztahu v datovém modelu. Podrobné informace naleznete v tématu Úprava datového modelu.
Datová aktiva vztahu jsou formátována do oddělených řádků (CSV nebo TSV). Existuje několik požadovaných datových sloupců:
- ID záznamů pro obě strany v každém vztahu
- Typy záznamů pro obě strany v každém vztahu
- Zaznamenat zdroje pro obě strany v každém vztahu
Datové aktivum vztahu můžete vytvořit ručně, pomocí procesu ETL nebo pomocí aplikace, kde jsou vaše relace uloženy.
Chcete-li přidat data vztahu do produktu IBM Match 360 z datového souboru CSV nebo TSV, postupujte takto:
V navigační nabídce klepněte na volbu Nastavení dat a otevřete obrazovku pro nastavení dat. Klepněte na Start with data assets nebo vyberte kartu Aktiva .
Načítat, mapovat a publikovat datová aktiva záznamu do produktu IBM Match 360. Tato datová aktiva by měla obsahovat data záznamu, která chcete přidružit pomocí relací. Podrobnosti viz Přidání dat záznamu z prostého datového souboru a Mapování vašich dat do datového modelu.
Načtěte soubor datového aktiva vztahu:
a. Klepněte na ikonu Odeslat aktivum do projektu na řádku s akcemi.
b. Na panelu Data, který se otevře, zvolte, zda chcete přidat data odesláním, z projektu nebo z katalogu. Chcete-li odeslat datový soubor, vyberte volbu Načíst.
Poznámka: Pokud vaše data obsahují řízené katalogy, možná nebudete moci zobrazit nebo přidat některá aktiva katalogu. V závislosti na vašich oprávněních možná budete moci zobrazit pouze aktiva katalogu, která vlastníte nebo spravujete.c. Na svém lokálním počítači vyberte prostý datový soubor obsahující data vztahů ve formátu CSV nebo TSV a přetáhněte jej na panel dat. Jakmile soubor dokončí nahrávání, přidá se do souhrnného seznamu vašich aktiv.
Zkontrolujte podrobnosti o aktivu nově přidaného vztahu.
Podržte ukazatel myši nad řádkem aktiva relace v souhrnném seznamu aktiv a klepněte na nabídku tříbodových přetečení.
Klepněte na volbu Nastavit vlastnosti aktiva.
Vyberte Relace ze seznamu Kategorie dat aktiva .
Vyberte správný typ vztahu ze seznamu Datový typ aktiva a klepněte na tlačítko Uložit. Pokud není vhodný typ relace v seznamu datových typů aktiv, možná budete muset přizpůsobit svůj datový model. Další informace naleznete v tématu Úprava datového modelu.
Mapujte a publikujte datové aktivum vztahu. Podrobné informace najdete v tématu Mapování dat na datový model. Dbejte na to, abyste namapovali každý z požadovaných datových sloupců:
from record ID
,to record ID
,from record type
,to record type
,from record source
ato record source
.Omezení: Data vztahů nepodporují profilování a automatické mapování. Ručně namapujte sloupce na datový model.
Publikování ukázkových dat
Pokud nemáte svá vlastní datová aktiva připravená ke spuštění, ale chcete začít používat službu IBM Match 360 , načtěte namísto toho vzorová data a model.
Chcete-li načíst ukázková data produktu IBM Match 360 , postupujte takto:
- Přejděte na domovskou stránku hlavních dat.
- V dlaždici Hlavní data klepněte na volbu Publikovat ukázkový model.
- Po dokončení ukázky ukázkového modelu klepněte na volbu Publikovat ukázková data.
- Volitelně můžete přejít na kartu Úlohy a sledovat průběh načítání ukázkových úloh načítání. Pokud nechcete sledovat průběh, můžete přejít na jinou obrazovku a úlohy budou pokračovat v práci na pozadí.
Další kroky
Další informace
Nadřízené téma: Konfigurace hlavních dat