Translation not up to date
Data můžete integrovat do notebooků pomocí přístupu k datům z lokálního souboru, z volných datových sad nebo z připojení zdroje dat. Tato data načtete do datové struktury nebo kontejneru v zápisníku, například pandas.DataFrame, numpy.array, Spark RDD nebo Spark DataFrame.
Chcete-li pracovat s daty v zápisníku, můžete si vybrat z následujících voleb:
Volba | Doporučená metoda | Požadavky | Podrobnosti |
---|---|---|---|
Přidat data ze souboru z lokálního systému | Použijte vygenerovaný kód pro vybraný zdroj dat klepnutím na ikonu Úseky kódu () na panelu nástrojů a klepnutím na volbu Číst data . | Soubor musí existovat jako aktivum projektu | Přidat soubor z lokálního systému |
Přidat data z volné datové sady z galerie | Použijte vygenerovaný kód pro vybraný zdroj dat klepnutím na ikonu Úseky kódu () na panelu nástrojů a klepnutím na volbu Číst data . | Datová sada (soubor) musí existovat jako aktivum projektu | Použít volnou datovou sadu z galerie |
Načíst data z připojení zdroje dat | Použijte vygenerovaný kód pro vybraný zdroj dat klepnutím na ikonu Úseky kódu () na panelu nástrojů a klepnutím na volbu Číst data . | Připojení musí existovat jako aktiva projektu | Načíst data z připojení zdroje dat |
Programový přístup k prostředkům projektu a metadatům | Použijte ibm-watson-studio-lib |
Zdroje dat musí existovat jako aktiva projektu | Použít knihovnu ibm-watson-studio-lib pro interakci s datovými aktivy |
Vytvořit a používat data úložiště funkcí | Použít funkce knihovny assetframe-lib |
Datová aktiva musí existovat jako aktiva v projektu | Pomocí knihovny assetframe-lib pro Python vytvořte a použijte data úložiště funkcí |
Přístup k datům pomocí funkce rozhraní API nebo příkazu operačního systému | Příklad: Wget |
Není k dispozici | Přístup k datům pomocí funkce rozhraní API nebo příkazu operačního systému |
Načíst data z lokálních souborů
Chcete-li přistupovat k datům z lokálního souboru, můžete soubor načíst z zápisníku nebo jej nejprve načíst do svého projektu. V zápisníku přidáte automaticky generovaný kód pro přístup k datům klepnutím na ikonu Úseky kódu () a následným klepnutím na volbu Číst data. Vygenerovaný kód slouží jako rychlý start, který vám umožní snadno začít pracovat s datovými sadami.
Kód je generován pro typy souborů, jako např. CSV, JSON a XLSX. Chcete-li zjistit, které datové struktury jsou generovány pro který jazyk zápisníku, prohlédněte si téma Podpora načtení dat. Pro typy souborů, pro které není generování kódu podporováno, můžete vložit pouze pověření souboru. Pomocí pověření můžete zapsat vlastní kód pro načtení dat souboru do DataFrame nebo jiné datové struktury v buňce zápisníku.
Chcete-li přidat soubor z lokálního systému do zápisníku, postupujte takto:
- Otevřete zápisník v režimu úprav, klepněte na ikonu Odeslat aktivum do projektu () na panelu nástrojů a poté procházejte datový soubor nebo jej přetáhněte do postranního panelu zápisníku.
- Klepněte na ikonu Úseky kódu (), klepněte na volbu Číst data a poté vyberte datový soubor z projektu. Chcete-li vybrat jiný datový soubor, použijte ikonu tužky.
- V rozevíracím seznamu Načíst jako vyberte volbu načtení, kterou upřednostňujete.
- Klepněte na prázdnou buňku kódu v zápisníku a poté klepnutím vložte vygenerovaný kód. Případně klepnutím zkopírujte vygenerovaný kód do schránky a vložte jej do zápisníku.
Chcete-li ručně přidat pověření souboru a zapsat kód pro metodu přístupu k souboru a vlastní DataFrame , postupujte takto:
- Přidejte soubor do úložiště objektů klepnutím na ikonu Odeslat aktivum do projektu () a následným procházením datového souboru nebo jeho přetažením do postranního panelu zápisníku.
- Klepněte na ikonu Úseky kódu () a poté klepněte na volbu Číst data.
- Klepněte na prázdnou buňku kódu v zápisníku, vyberte volbu načtení Pověřenía načtěte pověření do buňky. Můžete také klepnout a zkopírovat pověření do schránky a vložit je do zápisníku.
- Vložte pověření do příslušné metody pro jazyk zápisníku pro přístup k datům v zápisníku. Viz například tento kód v blogu pro Python.
- Chcete-li načíst data do DataFrame nebo do jiné datové struktury, odkazujte na metodu přístupu k datům v příslušné metodě čtení pro váš jazyk.
Načíst datové sady z galerie
Datové sady v galerii obsahují otevřená data. Podívejte se na toto krátké video, abyste viděli, jak pracovat s veřejnými datovými sadami v galerii.
Toto video poskytuje vizuální metodu, jak se seznámit s koncepty a úlohami v této dokumentaci.
Transkripce videa Čas transcript 00.00 Toto video ukazuje, jak přistupovat k veřejným datovým sadám v galerii Cloud Pak for Data as a Service . 00:06 Začněte v galerii a pomocí filtrů zobrazte pouze datové sady. 00:13-00:13 Zde najdete některé bohaté datové sady, které můžete použít ve své analýze. 00:17-00:17 Můžete například hledat "ekonomiku" nebo "obyvatelstvo" nebo "počasí" nebo "pracovní místa". 00:28-00:28 Vypadá to jako zajímavá datová sada. 00:30 Otevřete jej a zobrazte náhled dat. 00:34-00:34 Odtud můžete sdílet datovou sadu na sociálních médiích, získat přímý odkaz na datovou sadu nebo stáhnout datovou sadu. 00:45 00:45 Datovou sadu můžete také zkopírovat do specifického projektu. 00:52-00:52 Nyní přejděte k tomuto projektu. 00:55 A na kartě "Aktiva" uvidíte, že datová sada byla přidána do sekce datových aktiv. 01:01-01:01 Dále přidejte nový zápisník. 01:05-01:05 Název tohoto notebooku bude "Míra nezaměstnanosti". 01:09 Vyberte běhové prostředí a jazyk. 01:14-01:14 Až budete připraveni, vytvořte zápisník. 01:20-20 Když se zápisník načte, přistupte ke zdrojům dat a vyhledejte soubor nezaměstnanosti. 01:27 Klepněte na tlačítko "Vložit do kódu" a zvolte, jak chcete vložit data. 01:33 Volby v tomto rozevíracím poli závisí na jazyku použitém v tomto zápisníku. 01:38 Všimněte si, že vložený kód obsahuje pověření, která budete potřebovat ke čtení datového souboru z instance Object Storage . 01:45 01:45 Když spustíte kód, zobrazí se prvních pět řádků. 01:50 01:50 Nyní jste připraveni začít analyzovat všechny bohaté datové sady v galerii. 01:56-01:56 Další videa naleznete v dokumentaci k produktu Cloud Pak for Data as a Service .
Chcete-li přidat datovou sadu z galerie v zápisníku, zkopírujte datovou sadu do projektu:
- V navigační nabídce Cloud Pak for Data as a Service vyberte volbu Galerie.
- Vyhledejte kartu pro datovou sadu, kterou chcete přidat.
- Klepněte na volbu Přidat do projektu, vyberte projekt a klepněte na tlačítko Přidat. Klepnutím na volbu Zobrazit projekt přejdete na stránku Přehled projektu. Datové aktivum se přidá do seznamu datových aktiv na stránce Aktiva projektu.
- Otevřete zápisník v režimu úprav, klepněte na ikonu Úseky kódu () na panelu nástrojů, klepněte na volbu Číst data a poté vyberte datové aktivum z projektu.
- V rozevíracím seznamu Načíst jako vyberte volbu načtení, kterou upřednostňujete.
- Klepněte na prázdnou buňku kódu v zápisníku a poté klepnutím vložte vygenerovaný kód. Případně klepnutím zkopírujte vygenerovaný kód do schránky a vložte jej do zápisníku. Vygenerovaný kód slouží jako rychlý start pro zahájení práce s datovou sadou nebo připojením. U výrobních systémů pečlivě zkontrolujte vložený kód, abyste zjistili, zda byste měli napsat svůj vlastní kód, který lépe vyhovuje vašim potřebám.
Načíst data z připojení zdroje dat
Než budete moci načíst data z datové služby IBM nebo z externího zdroje dat, musíte vytvořit nebo přidat připojení k projektu. Viz Přidání připojení k projektům.
Automaticky generovaný kód pro načtení dat z databázových připojení přidáte klepnutím na ikonu Úseky kódu () na panelu nástrojů zápisníku a následným klepnutím na volbu Číst data. Chcete-li zjistit, která databázová připojení jsou podporována, prohlédněte si téma Podpora načtení dat. U databázových připojení, která nejsou podporována, můžete vložit pouze pověření databázového připojení. Pomocí pověření můžete zapsat vlastní kód pro načtení dat do DataFrame nebo jiné datové struktury v buňce zápisníku.
Chcete-li načíst data z existujícího připojení zdroje dat do datové struktury v zápisníku, postupujte takto:
- Otevřete zápisník v režimu úprav, klepněte na ikonu Úseky kódu () na panelu nástrojů, klepněte na volbu Číst data a vyberte připojení zdroje dat z projektu. Chcete-li vybrat jiné připojení, použijte ikonu tužky.
- Vyberte schéma a vyberte tabulku. Chcete-li změnit svůj výběr, použijte ikonu tužky.
- Vyberte volbu načtení. Pokud vyberete pověření a ne volbu načtení dat po výběru schématu a tabulky, budou generována pouze metadata.
- Klepněte na prázdnou buňku kódu v zápisníku a poté vložte kód do buňky. Případně klepnutím zkopírujte vygenerovaný kód do schránky a vložte jej do zápisníku. Vygenerovaný kód slouží jako rychlý start pro zahájení práce s datovou sadou nebo připojením. U výrobních systémů pečlivě zkontrolujte vložený kód, abyste zjistili, zda byste měli napsat svůj vlastní kód, který lépe vyhovuje vašim potřebám.
- V případě potřeby zadejte osobní pověření pro uzamčená datová připojení, která jsou označena ikonou klíče (). Jedná se o jednorázový krok, který trvale odemkne připojení. Po odemknutí připojení se ikona klíče již nezobrazí. Viz Přidání připojení k projektům.
- Pokud pro připojení nelze vygenerovat žádný kód, načtěte pověření a otevřete databázové připojení, které odkazuje na vaše pověření. Zapište kód pro načtení dat.
Použít funkci rozhraní API nebo příkaz operačního systému pro přístup k datům
Můžete použít funkce rozhraní API nebo příkazy operačního systému v zápisníku pro přístup k datům, například příkaz Wget
pro přístup k datům pomocí protokolů HTTP, HTTPS nebo FTP. Když použijete tyto typy funkcí a příkazů rozhraní API, musíte zahrnout kód, který nastaví přístupový prvek projektu. Viz Ručně přidat přístupový prvek projektu.
Další informace
Použijte knihovnu ibm-watson-studio-lib k programové interakci s aktivy projektu. Knihovna
ibm-watson-studio-lib
je následníkem knihovnyproject-lib
. Chcete-li přejít zproject-lib
na použitíibm-watson-studio-lib
, prohlédněte si:
Nadřízené téma: Zápisníky a skripty