0 / 0
Go back to the English version of the documentation
Obsługa ładowania danych
Last updated: 10 sie 2023
Obsługa ładowania danych

Istnieje możliwość dodania automatycznie wygenerowanego kodu w celu załadowania danych z zasobów danych projektu do komórki notatnika. Typem zasobu aplikacyjnego może być plik lub połączenie z bazą danych.

Klikając pustą komórkę kodu w notatniku, klikając ikonę fragmenty kodu (ikona kodu fragmenty kodu) na pasku narzędzi notatnika, wybierając opcję Odczyt danych i zasób aplikacyjny z projektu, można:

  • Wstaw informacje autoryzacyjne dostępu do źródła danych. Ta możliwość jest dostępna dla wszystkich zasobów danych, które są dodawane do projektu. Korzystając z referencji, można napisać własny kod, aby uzyskać dostęp do zasobu i załadować dane do struktur danych wybranej przez użytkownika.

  • Generowanie kodu dodawanego do komórki notatnika. Wstawiony kod służy jako szybki start, co pozwala na łatwe rozpoczęcie pracy z zestawem danych lub połączeniem. W przypadku systemów produkcyjnych należy dokładnie zapoznać się z wstawionym kodem, aby określić, czy należy napisać własny kod, który lepiej spełnia Twoje potrzeby.

    Po uruchomieniu komórki kodu dostęp do danych jest uzyskiwany i ładowany do wybranej struktury danych.

    Uwagi:

    1. Możliwość udostępnienia wygenerowanego kodu jest wyłączona dla niektórych połączeń, jeśli:
      • Referencje połączenia są danymi osobistymi.
      • Połączenie korzysta z łącza bezpiecznej bramy
      • Referencje połączenia są przechowywane w skarbcach
    2. Jeśli używany typ pliku lub połączenie z bazą danych nie jest wyświetlane na poniższych listach, można wybrać opcję utworzenia kodu ogólnego. Dla Python jest to obiekt StreamingBody i dla obiektu R obiekt textConnection .

Poniższe tabele zawierają informacje o tym, które połączenia ze źródłem danych (typy plików i połączenia z bazą danych) obsługują opcję generowania kodu. Opcje generowania kodu różnią się w zależności od źródła danych, języka kodowania notatnika i obliczeniowego środowiska wykonawczego notebooka.

Obsługiwane typy plików

Tabela 1. Obsługiwane typy plików:
Źródło danych Język kodowania notatnika Typ mechanizmu obliczeniowego Dostępne wsparcie dla ładowania danych
CSV, pliki
Python Dystrybucja Anaconda Python Ładowanie danych do ramki pandasData
Ze Spark Ładowanie danych do ramki pandasDatai sparkSessionDataFrame
Za pomocą komendy Hadoop Ładowanie danych do ramki pandasDatai sparkSessionDataFrame
R Dystrybucja Anaconda R Ładowanie danych do ramki danych R
Ze Spark Ładowanie danych do ramki danych R i sparkSessionDataFrame
Za pomocą komendy Hadoop Ładowanie danych do ramki danych R i sparkSessionDataFrame
Skrypt Python
Python Dystrybucja Anaconda Python Ładowanie danych do treści pandasStreaming
Ze Spark Ładowanie danych do treści pandasStreaming
Za pomocą komendy Hadoop Ładowanie danych do treści pandasStreaming
R Dystrybucja Anaconda R Ładuj dane do obiektu rRaw
Ze Spark Ładuj dane do obiektu rRaw
Za pomocą komendy Hadoop Ładuj dane do obiektu rRaw
pliki JSON
Python Dystrybucja Anaconda Python Ładowanie danych do ramki pandasData
Ze Spark Ładowanie danych do ramki pandasDatai sparkSessionDataFrame
Za pomocą komendy Hadoop Ładowanie danych do ramki pandasDatai sparkSessionDataFrame
R Dystrybucja Anaconda R Ładowanie danych do ramki danych R
Ze Spark Ładuj dane do ramki danych R, rRawObject i sparkSessionDataFrame
Za pomocą komendy Hadoop Ładuj dane do ramki danych R, rRawObject i sparkSessionDataFrame
Pliki .xlsx i .xls
Python Dystrybucja Anaconda Python Ładowanie danych do ramki pandasData
Ze Spark Ładowanie danych do ramki pandasData
Za pomocą komendy Hadoop Ładowanie danych do ramki pandasData
R Dystrybucja Anaconda R Ładuj dane do obiektu rRaw
Ze Spark Brak obsługi ładowania danych
Za pomocą komendy Hadoop Brak obsługi ładowania danych
Typy plików oktetów
Python Dystrybucja Anaconda Python Ładowanie danych do treści pandasStreaming
Ze Spark Ładowanie danych do treści pandasStreaming
R Dystrybucja Anaconda R Ładuj dane w obiekcie rRaw
Ze Spark Ładowanie danych w obiekcie rData
Typ pliku PDF
Python Dystrybucja Anaconda Python Ładowanie danych do treści pandasStreaming
Ze Spark Ładowanie danych do treści pandasStreaming
Za pomocą komendy Hadoop Ładowanie danych do treści pandasStreaming
R Dystrybucja Anaconda R Ładuj dane w obiekcie rRaw
Ze Spark Ładowanie danych w obiekcie rData
Za pomocą komendy Hadoop Ładuj dane do danych rRaw
Typ pliku ZIP
Python Dystrybucja Anaconda Python Ładowanie danych do treści pandasStreaming
Ze Spark Ładowanie danych do treści pandasStreaming
R Dystrybucja Anaconda R Ładuj dane w obiekcie rRaw
Ze Spark Ładowanie danych w obiekcie rData
Pliki graficzne JPEG, PNG
Python Dystrybucja Anaconda Python Ładowanie danych do treści pandasStreaming
Ze Spark Ładowanie danych do treści pandasStreaming
Za pomocą komendy Hadoop Ładowanie danych do treści pandasStreaming
R Dystrybucja Anaconda R Ładuj dane w obiekcie rRaw
Ze Spark Ładowanie danych w obiekcie rData
Za pomocą komendy Hadoop Ładowanie danych w obiekcie rData
Pliki binarne
Python Dystrybucja Anaconda Python Ładowanie danych do treści pandasStreaming
Ze Spark Ładowanie danych do treści pandasStreaming
Hadoop Brak obsługi ładowania danych
R Dystrybucja Anaconda R Ładuj dane w obiekcie rRaw
Ze Spark Ładuj dane do obiektu rRaw
Hadoop Ładowanie danych w obiekcie rData

Obsługiwane połączenia z bazą danych

Tabela 2. Obsługiwane połączenia z bazą danych
Źródło danych Język kodowania notatnika Typ mechanizmu obliczeniowego Dostępne wsparcie dla ładowania danych
- Db2 Warehouse on Cloud
- IBM Db2 on Cloud
- Baza danychIBM Db2 Database
Python Dystrybucja Anaconda Python Ładowanie danych do systemów ibmdbpyIda i ibmdbpyPandas
Ze Spark Ładowanie danych do systemu ibmdbpyIda, ibmdbpyPandas i sparkSessionDataFrame
Za pomocą komendy Hadoop Ładowanie danych do systemu ibmdbpyIda, ibmdbpyPandas i sparkSessionDataFrame
R Dystrybucja Anaconda R Ładowanie danych do plików ibmdbrIda i ibmdbrDataframe
Ze Spark Ładowanie danych do ramek ibmdbrIda, ibmdbrDatai sparkSessionDataFrame
Za pomocą komendy Hadoop Ładowanie danych do ramek ibmdbrIda, ibmdbrDatai sparkSessionDataFrame
- Db2 for z/OS
Python Dystrybucja Anaconda Python Ładowanie danych do systemów ibmdbpyIda i ibmdbpyPandas
Ze Spark Brak obsługi ładowania danych
- Amazon Simple Storage Services (S3)
- Amazon Simple Storage Services (S3) z polityką dostępu IAM
Python Dystrybucja Anaconda Python Ładowanie danych do treści pandasStreaming
Za pomocą komendy Hadoop Ładowanie danych do treści pandasStreamingBody i sparkSessionSetup
R Anaconda R distributuion Ładuj dane do obiektu rRaw
Za pomocą komendy Hadoop Ładowanie danych do obiektów rRawi konfiguracji sparkSession
- IBM Cloud Databases for PostgreSQL
- Microsoft SQL Server
Python Dystrybucja Anaconda Python Ładowanie danych do ramki pandasData
Ze Spark Ładowanie danych do ramki pandasData
R Dystrybucja Anaconda R Ładowanie danych do ramki danych R
Ze Spark Ładowanie danych do ramki danych R i sparkSessionDataFrame
Python Dystrybucja Anaconda Python Załaduj dane do ramki pandasData

W wygenerowanym kodzie:
-Edytuj parametr ścieżki w ostatnim wierszu kodu
-Usuń znaczniki komentarza

Aby odczytać dane, patrz Odczytywanie danych ze źródła danych
Aby wyszukać dane, patrz Wyszukiwanie obiektów danych
W celu zapisania danych patrz Zapisywanie danych w źródle danych .
Ze Spark Brak obsługi ładowania danych
R Dystrybucja Anaconda R Załaduj dane do ramki danych R

W wygenerowanym kodzie:
-Edytuj parametr ścieżki w ostatnim wierszu kodu
-Usuń znaczniki komentarza

W celu odczytania danych, Patrz sekcja Odczytywanie danych ze źródła danych
W celu wyszukania danych patrz sekcja Wyszukiwanie obiektów danych
W celu zapisania danych zapoznaj się z sekcji Zapis danych do źródła danych .
Ze Spark Brak obsługi ładowania danych
Python Dystrybucja Anaconda Python Ładowanie danych do ramki pandasData
Ze Spark Ładowanie danych do ramki pandasData
R Dystrybucja Anaconda R Brak obsługi ładowania danych
Ze Spark Brak obsługi ładowania danych
- Amazon RDS for MySQL
Python Dystrybucja Anaconda Python Ładowanie danych do ramki pandasData
Ze Spark Ładowanie danych do ramki pandasData
R Dystrybucja Anaconda R Ładowanie danych do ramki danych R i sparkSessionDataFrame
Ze Spark Brak obsługi ładowania danych
- HTTP
- Apache Cassandra
- Amazon RDS for PostgreSQL
Python Dystrybucja Anaconda Python Ładowanie danych do ramki pandasData
Ze Spark Ładowanie danych do ramki pandasData
R Dystrybucja Anaconda R Ładowanie danych do ramki danych R
Ze Spark Ładowanie danych do ramki danych R

Temat nadrzędny: Ładowanie i uzyskiwanie dostępu do danych w notatniku

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more