0 / 0
Go back to the English version of the documentation
Načtení a přístup k datům v zápisníku
Last updated: 09. 11. 2023
Načtení a přístup k datům v zápisníku

Data můžete integrovat do notebooků pomocí přístupu k datům z lokálního souboru, z volných datových sad nebo z připojení zdroje dat. Tato data načtete do datové struktury nebo kontejneru v zápisníku, například pandas.DataFrame, numpy.array, Spark RDD nebo Spark DataFrame.

Chcete-li pracovat s daty v zápisníku, můžete si vybrat z následujících voleb:

Volba Doporučená metoda Požadavky Podrobnosti
Přidat data ze souboru z lokálního systému Použijte vygenerovaný kód pro vybraný zdroj dat klepnutím na ikonu Úseky kódu (Ikona Úseky kódu) na panelu nástrojů a klepnutím na volbu Číst data . Soubor musí existovat jako aktivum projektu Přidat soubor z lokálního systému
Přidat data z volné datové sady z galerie Použijte vygenerovaný kód pro vybraný zdroj dat klepnutím na ikonu Úseky kódu (Ikona Úseky kódu) na panelu nástrojů a klepnutím na volbu Číst data . Datová sada (soubor) musí existovat jako aktivum projektu Použít volnou datovou sadu z galerie
Načíst data z připojení zdroje dat Použijte vygenerovaný kód pro vybraný zdroj dat klepnutím na ikonu Úseky kódu (Ikona Úseky kódu) na panelu nástrojů a klepnutím na volbu Číst data . Připojení musí existovat jako aktiva projektu Načíst data z připojení zdroje dat
Programový přístup k prostředkům projektu a metadatům Použijte ibm-watson-studio-lib Zdroje dat musí existovat jako aktiva projektu Použít knihovnu ibm-watson-studio-lib pro interakci s datovými aktivy
Vytvořit a používat data úložiště funkcí Použít funkce knihovny assetframe-lib Datová aktiva musí existovat jako aktiva v projektu Pomocí knihovny assetframe-lib pro Python vytvořte a použijte data úložiště funkcí
Přístup k datům pomocí funkce rozhraní API nebo příkazu operačního systému Příklad: Wget Není k dispozici Přístup k datům pomocí funkce rozhraní API nebo příkazu operačního systému
Důležité: Ujistěte se, že prostředí, ve kterém je zápisník spuštěn, má dostatek paměti pro uložení dat, která načtete do zápisníku. Prostředí musí mít podstatně více paměti, než je celková velikost dat načtených do zápisníku. Některé datové rámce, například pandas, mohou obsahovat více kopií dat v paměti.

Načíst data z lokálních souborů

Chcete-li přistupovat k datům z lokálního souboru, můžete soubor načíst z zápisníku nebo jej nejprve načíst do svého projektu. V zápisníku přidáte automaticky generovaný kód pro přístup k datům klepnutím na ikonu Úseky kódu (Ikona Úseky kódu) a následným klepnutím na volbu Číst data. Vygenerovaný kód slouží jako rychlý start, který vám umožní snadno začít pracovat s datovými sadami.

Kód je generován pro typy souborů, jako např. CSV, JSON a XLSX. Chcete-li zjistit, které datové struktury jsou generovány pro který jazyk zápisníku, prohlédněte si téma Podpora načtení dat. Pro typy souborů, pro které není generování kódu podporováno, můžete vložit pouze pověření souboru. Pomocí pověření můžete zapsat vlastní kód pro načtení dat souboru do DataFrame nebo jiné datové struktury v buňce zápisníku.

Chcete-li přidat soubor z lokálního systému do zápisníku, postupujte takto:

  1. Otevřete zápisník v režimu úprav, klepněte na ikonu Odeslat aktivum do projektu (Zobrazí ikonu Odeslat aktivum do projektu) na panelu nástrojů a poté procházejte datový soubor nebo jej přetáhněte do postranního panelu zápisníku.
  2. Klepněte na ikonu Úseky kódu (Ikona Úseky kódu), klepněte na volbu Číst data a poté vyberte datový soubor z projektu. Chcete-li vybrat jiný datový soubor, použijte ikonu tužky.
  3. V rozevíracím seznamu Načíst jako vyberte volbu načtení, kterou upřednostňujete.
  4. Klepněte na prázdnou buňku kódu v zápisníku a poté klepnutím vložte vygenerovaný kód. Případně klepnutím zkopírujte vygenerovaný kód do schránky a vložte jej do zápisníku.

Chcete-li ručně přidat pověření souboru a zapsat kód pro metodu přístupu k souboru a vlastní DataFrame , postupujte takto:

  1. Přidejte soubor do úložiště objektů klepnutím na ikonu Odeslat aktivum do projektu (Zobrazí ikonu Odeslat aktivum do projektu) a následným procházením datového souboru nebo jeho přetažením do postranního panelu zápisníku.
  2. Klepněte na ikonu Úseky kódu (Ikona Úseky kódu) a poté klepněte na volbu Číst data.
  3. Klepněte na prázdnou buňku kódu v zápisníku, vyberte volbu načtení Pověřenía načtěte pověření do buňky. Můžete také klepnout a zkopírovat pověření do schránky a vložit je do zápisníku.
  4. Vložte pověření do příslušné metody pro jazyk zápisníku pro přístup k datům v zápisníku. Viz například tento kód v blogu pro Python.
  5. Chcete-li načíst data do DataFrame nebo do jiné datové struktury, odkazujte na metodu přístupu k datům v příslušné metodě čtení pro váš jazyk.

Načíst datové sady z galerie

Datové sady v galerii obsahují otevřená data. Podívejte se na toto krátké video, abyste viděli, jak pracovat s veřejnými datovými sadami v galerii.

Toto video poskytuje vizuální metodu, jak se seznámit s koncepty a úlohami v této dokumentaci.


Chcete-li přidat datovou sadu z galerie v zápisníku, zkopírujte datovou sadu do projektu:

  1. V navigační nabídce Cloud Pak for Data as a Service vyberte volbu Galerie.
  2. Vyhledejte kartu pro datovou sadu, kterou chcete přidat. Zobrazení datových sad
  3. Klepněte na volbu Přidat do projektu, vyberte projekt a klepněte na tlačítko Přidat. Klepnutím na volbu Zobrazit projekt přejdete na stránku Přehled projektu. Datové aktivum se přidá do seznamu datových aktiv na stránce Aktiva projektu.
  4. Otevřete zápisník v režimu úprav, klepněte na ikonu Úseky kódu (Ikona Úseky kódu) na panelu nástrojů, klepněte na volbu Číst data a poté vyberte datové aktivum z projektu.
  5. V rozevíracím seznamu Načíst jako vyberte volbu načtení, kterou upřednostňujete.
  6. Klepněte na prázdnou buňku kódu v zápisníku a poté klepnutím vložte vygenerovaný kód. Případně klepnutím zkopírujte vygenerovaný kód do schránky a vložte jej do zápisníku. Vygenerovaný kód slouží jako rychlý start pro zahájení práce s datovou sadou nebo připojením. U výrobních systémů pečlivě zkontrolujte vložený kód, abyste zjistili, zda byste měli napsat svůj vlastní kód, který lépe vyhovuje vašim potřebám.

Načíst data z připojení zdroje dat

Než budete moci načíst data z datové služby IBM nebo z externího zdroje dat, musíte vytvořit nebo přidat připojení k projektu. Viz Přidání připojení k projektům.

Automaticky generovaný kód pro načtení dat z databázových připojení přidáte klepnutím na ikonu Úseky kódu (Ikona Úseky kódu) na panelu nástrojů zápisníku a následným klepnutím na volbu Číst data. Chcete-li zjistit, která databázová připojení jsou podporována, prohlédněte si téma Podpora načtení dat. U databázových připojení, která nejsou podporována, můžete vložit pouze pověření databázového připojení. Pomocí pověření můžete zapsat vlastní kód pro načtení dat do DataFrame nebo jiné datové struktury v buňce zápisníku.

Chcete-li načíst data z existujícího připojení zdroje dat do datové struktury v zápisníku, postupujte takto:

  1. Otevřete zápisník v režimu úprav, klepněte na ikonu Úseky kódu (Ikona Úseky kódu) na panelu nástrojů, klepněte na volbu Číst data a vyberte připojení zdroje dat z projektu. Chcete-li vybrat jiné připojení, použijte ikonu tužky.
  2. Vyberte schéma a vyberte tabulku. Chcete-li změnit svůj výběr, použijte ikonu tužky.
  3. Vyberte volbu načtení. Pokud vyberete pověření a ne volbu načtení dat po výběru schématu a tabulky, budou generována pouze metadata.
  4. Klepněte na prázdnou buňku kódu v zápisníku a poté vložte kód do buňky. Případně klepnutím zkopírujte vygenerovaný kód do schránky a vložte jej do zápisníku. Vygenerovaný kód slouží jako rychlý start pro zahájení práce s datovou sadou nebo připojením. U výrobních systémů pečlivě zkontrolujte vložený kód, abyste zjistili, zda byste měli napsat svůj vlastní kód, který lépe vyhovuje vašim potřebám.
  5. V případě potřeby zadejte osobní pověření pro uzamčená datová připojení, která jsou označena ikonou klíče (symbol klíče pro připojení s osobními pověřeními). Jedná se o jednorázový krok, který trvale odemkne připojení. Po odemknutí připojení se ikona klíče již nezobrazí. Viz Přidání připojení k projektům.
  6. Pokud pro připojení nelze vygenerovat žádný kód, načtěte pověření a otevřete databázové připojení, které odkazuje na vaše pověření. Zapište kód pro načtení dat.

Použít funkci rozhraní API nebo příkaz operačního systému pro přístup k datům

Můžete použít funkce rozhraní API nebo příkazy operačního systému v zápisníku pro přístup k datům, například příkaz Wget pro přístup k datům pomocí protokolů HTTP, HTTPS nebo FTP. Když použijete tyto typy funkcí a příkazů rozhraní API, musíte zahrnout kód, který nastaví přístupový prvek projektu. Viz Ručně přidat přístupový prvek projektu.

Další informace

Nadřízené téma: Zápisníky a skripty

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more