Translation not up to date
Po vytvoření projektu je dalším krokem přidání datových aktiv do projektu, abyste mohli pracovat s daty. Všichni spolupracovníci v projektu jsou automaticky autorizováni pro přístup k datům v projektu.
Různé typy aktiv mohou mít duplicitní názvy. Typ aktiva se stejným názvem však nelze přidat vícekrát.
K přidání datových aktiv do projektů můžete použít následující metody:
Metoda | Kdy použít |
---|---|
Přidat lokální soubory | Máte data v CSV nebo podobných souborech na lokálním systému. |
Přidat datové sady galerie | Chcete použít ukázkové datové sady. |
Přidat databázová připojení | Musíte se připojit ke vzdálenému zdroji dat. |
Přidat data z připojení | Potřebujete jednu nebo více tabulek nebo souborů ze vzdáleného zdroje dat. |
Importovat metadata z připojení | Potřebujete mnoho tabulek nebo souborů ze vzdáleného zdroje dat. Chcete naplánovat a znovu spustit proces importu. |
Přidat připojená aktiva složky z produktu IBM Cloud Object Storage | Potřebujete složku v produktu IBM Cloud Object Storage , která obsahuje dynamickou sadu souborů, jako např. kanál zpráv. |
Přidat aktiva katalogu | Potřebujete jedno nebo více aktiv z katalogu. |
Převést soubory v úložišti projektu na aktiva | Chcete převést soubory, které jste vytvořili v projektu, na datová aktiva. |
Přidat lokální soubory
Můžete přidat soubor z lokálního systému jako datové aktivum v projektu.
- Nezbytná oprávnění
V projektu musíte mít roli Editor nebo Administrátor .
- Omezení
- Soubor nemůže být prázdný.
- Název souboru nemůže obsahovat tyto znaky:
< > : ” / | ( ) ?
- Název souboru nemůže obsahovat tyto znaky:
- Název souboru nesmí překročit 255 znaků.
- Maximální velikost souborů, které můžete načíst pomocí uživatelského rozhraní, je 5 GB. Pomocí rozhraní API můžete načíst větší soubory do projektu .
Chcete-li přidat datové soubory do projektu, postupujte takto:
Na stránce Aktiva vašeho projektu klepněte na ikonu Odeslat aktivum do projektu (). Můžete také klepnout na stejnou ikonu () v rámci zápisníku nebo plátna.
V podokně, které se otevře, vyhledejte soubory nebo je přetáhněte do podokna. Musíte zůstat na stránce, dokud nebude načtení dokončeno. Chcete-li zastavit načítání souboru, můžete probíhající proces načítání zrušit.
Soubory jsou uloženy v úložišti objektů, které je přidruženo k vašemu projektu, a jsou uvedeny jako datová aktiva na stránce Aktiva vašeho projektu.
Když klepnete na název datového aktiva, můžete zobrazit tyto informace o datových aktivech ze souborů:
- Název a popis aktiva
- Značky pro aktivum
- Jméno osoby, která vytvořila aktivum
- Velikost dat
- Datum, kdy bylo aktivum přidáno do projektu
- Datum, kdy bylo aktivum naposledy upraveno
- Náhled dat pro soubory CSV, Avro, Parquet, TSV, Microsoft Excel, PDF, text, JSON a obrazové soubory.
- Profil dat pro soubory CSV, Avro, Parquet, TSV a Microsoft Excel.
Obsah datového aktiva můžete aktualizovat ze souboru přidáním souboru se stejným názvem a formátem do projektu a následným výběrem nahrazení existujícího datového aktiva.
Datové aktivum můžete odebrat výběrem volby Odstranit z nabídky akcí vedle názvu aktiva. Vyberte volbu Připravit data , abyste upřesnili data pomocí produktu Data Refinery.
Přidat datové sady galerie
Můžete přidat datové sady z galerie do svého projektu:
- V galerii vyhledejte kartu pro datovou sadu, kterou chcete přidat.
- Na řádku s akcemi klepněte na ikonu Přidat do projektu , vyberte projekt a klepněte na tlačítko Přidat.
Podívejte se na toto krátké video, abyste viděli, jak načíst a analyzovat veřejné datové sady.
Toto video poskytuje vizuální metodu, jak se seznámit s koncepty a úlohami v této dokumentaci.
Transkripce videa Čas transcript 00.00 Toto video ukazuje, jak přistupovat k veřejným datovým sadám v galerii Cloud Pak for Data as a Service . 00:06 Začněte v galerii a pomocí filtrů zobrazte pouze datové sady. 00:13-00:13 Zde najdete některé bohaté datové sady, které můžete použít ve své analýze. 00:17-00:17 Můžete například hledat "ekonomiku" nebo "obyvatelstvo" nebo "počasí" nebo "pracovní místa". 00:28-00:28 Vypadá to jako zajímavá datová sada. 00:30 Otevřete jej a zobrazte náhled dat. 00:34-00:34 Odtud můžete sdílet datovou sadu na sociálních médiích, získat přímý odkaz na datovou sadu nebo stáhnout datovou sadu. 00:45 00:45 Datovou sadu můžete také zkopírovat do specifického projektu. 00:52-00:52 Nyní přejděte k tomuto projektu. 00:55 A na kartě "Aktiva" uvidíte, že datová sada byla přidána do sekce datových aktiv. 01:01-01:01 Dále přidejte nový zápisník. 01:05-01:05 Název tohoto notebooku bude "Míra nezaměstnanosti". 01:09 Vyberte běhové prostředí a jazyk. 01:14-01:14 Až budete připraveni, vytvořte zápisník. 01:20-20 Když se zápisník načte, přistupte ke zdrojům dat a vyhledejte soubor nezaměstnanosti. 01:27 Klepněte na tlačítko "Vložit do kódu" a zvolte, jak chcete vložit data. 01:33 Volby v tomto rozevíracím poli závisí na jazyku použitém v tomto zápisníku. 01:38 Všimněte si, že vložený kód obsahuje pověření, která budete potřebovat ke čtení datového souboru z instance Object Storage . 01:45 01:45 Když spustíte kód, zobrazí se prvních pět řádků. 01:50 01:50 Nyní jste připraveni začít analyzovat všechny bohaté datové sady v galerii. 01:56-01:56 Další videa naleznete v dokumentaci k produktu Cloud Pak for Data as a Service .
Převést soubory v úložišti projektu na aktiva
Úložiště projektu obsahuje datová aktiva, která jste odeslali do projektu, ale může také obsahovat další soubory. Můžete například uložit DataFrame do zápisníku v úložišti prostředí projektu. Soubory v úložišti projektu můžete převést na aktiva.
Chcete-li převést soubory v úložišti projektu na aktiva, postupujte takto:
- Na kartě Aktiva vašeho projektu klepněte na volbu Importovat aktivum.
- Vyberte volbu Soubory projektu.
- Vyberte složku data_asset .
- Vyberte aktivum a klepněte na tlačítko Importovat.
Další kroky
Další informace
Nadřízené téma: Příprava dat