Translation not up to date
Istnieje możliwość dodania automatycznie wygenerowanego kodu w celu załadowania danych z zasobów danych projektu do komórki notatnika. Typem zasobu aplikacyjnego może być plik lub połączenie z bazą danych.
Klikając pustą komórkę kodu w notatniku, klikając ikonę fragmenty kodu () na pasku narzędzi notatnika, wybierając opcję Odczyt danych i zasób aplikacyjny z projektu, można:
Wstaw informacje autoryzacyjne dostępu do źródła danych. Ta możliwość jest dostępna dla wszystkich zasobów danych, które są dodawane do projektu. Korzystając z referencji, można napisać własny kod, aby uzyskać dostęp do zasobu i załadować dane do struktur danych wybranej przez użytkownika.
Generowanie kodu dodawanego do komórki notatnika. Wstawiony kod służy jako szybki start, co pozwala na łatwe rozpoczęcie pracy z zestawem danych lub połączeniem. W przypadku systemów produkcyjnych należy dokładnie zapoznać się z wstawionym kodem, aby określić, czy należy napisać własny kod, który lepiej spełnia Twoje potrzeby.
Po uruchomieniu komórki kodu dostęp do danych jest uzyskiwany i ładowany do wybranej struktury danych.
Uwagi:
- Możliwość udostępnienia wygenerowanego kodu jest wyłączona dla niektórych połączeń, jeśli:
- Referencje połączenia są danymi osobistymi.
- Połączenie korzysta z łącza bezpiecznej bramy
- Referencje połączenia są przechowywane w skarbcach
- Jeśli używany typ pliku lub połączenie z bazą danych nie jest wyświetlane na poniższych listach, można wybrać opcję utworzenia kodu ogólnego. Dla Python jest to obiekt StreamingBody i dla obiektu R obiekt textConnection .
- Możliwość udostępnienia wygenerowanego kodu jest wyłączona dla niektórych połączeń, jeśli:
Poniższe tabele zawierają informacje o tym, które połączenia ze źródłem danych (typy plików i połączenia z bazą danych) obsługują opcję generowania kodu. Opcje generowania kodu różnią się w zależności od źródła danych, języka kodowania notatnika i obliczeniowego środowiska wykonawczego notebooka.
Obsługiwane typy plików
Źródło danych | Język kodowania notatnika | Typ mechanizmu obliczeniowego | Dostępne wsparcie dla ładowania danych |
---|---|---|---|
CSV, pliki | |||
Python | Dystrybucja Anaconda Python | Ładowanie danych do ramki pandasData | |
Ze Spark | Ładowanie danych do ramki pandasDatai sparkSessionDataFrame | ||
Za pomocą komendy Hadoop | Ładowanie danych do ramki pandasDatai sparkSessionDataFrame | ||
R | Dystrybucja Anaconda R | Ładowanie danych do ramki danych R | |
Ze Spark | Ładowanie danych do ramki danych R i sparkSessionDataFrame | ||
Za pomocą komendy Hadoop | Ładowanie danych do ramki danych R i sparkSessionDataFrame | ||
Skrypt Python | |||
Python | Dystrybucja Anaconda Python | Ładowanie danych do treści pandasStreaming | |
Ze Spark | Ładowanie danych do treści pandasStreaming | ||
Za pomocą komendy Hadoop | Ładowanie danych do treści pandasStreaming | ||
R | Dystrybucja Anaconda R | Ładuj dane do obiektu rRaw | |
Ze Spark | Ładuj dane do obiektu rRaw | ||
Za pomocą komendy Hadoop | Ładuj dane do obiektu rRaw | ||
pliki JSON | |||
Python | Dystrybucja Anaconda Python | Ładowanie danych do ramki pandasData | |
Ze Spark | Ładowanie danych do ramki pandasDatai sparkSessionDataFrame | ||
Za pomocą komendy Hadoop | Ładowanie danych do ramki pandasDatai sparkSessionDataFrame | ||
R | Dystrybucja Anaconda R | Ładowanie danych do ramki danych R | |
Ze Spark | Ładuj dane do ramki danych R, rRawObject i sparkSessionDataFrame | ||
Za pomocą komendy Hadoop | Ładuj dane do ramki danych R, rRawObject i sparkSessionDataFrame | ||
Pliki .xlsx i .xls | |||
Python | Dystrybucja Anaconda Python | Ładowanie danych do ramki pandasData | |
Ze Spark | Ładowanie danych do ramki pandasData | ||
Za pomocą komendy Hadoop | Ładowanie danych do ramki pandasData | ||
R | Dystrybucja Anaconda R | Ładuj dane do obiektu rRaw | |
Ze Spark | Brak obsługi ładowania danych | ||
Za pomocą komendy Hadoop | Brak obsługi ładowania danych | ||
Typy plików oktetów | |||
Python | Dystrybucja Anaconda Python | Ładowanie danych do treści pandasStreaming | |
Ze Spark | Ładowanie danych do treści pandasStreaming | ||
R | Dystrybucja Anaconda R | Ładuj dane w obiekcie rRaw | |
Ze Spark | Ładowanie danych w obiekcie rData | ||
Typ pliku PDF | |||
Python | Dystrybucja Anaconda Python | Ładowanie danych do treści pandasStreaming | |
Ze Spark | Ładowanie danych do treści pandasStreaming | ||
Za pomocą komendy Hadoop | Ładowanie danych do treści pandasStreaming | ||
R | Dystrybucja Anaconda R | Ładuj dane w obiekcie rRaw | |
Ze Spark | Ładowanie danych w obiekcie rData | ||
Za pomocą komendy Hadoop | Ładuj dane do danych rRaw | ||
Typ pliku ZIP | |||
Python | Dystrybucja Anaconda Python | Ładowanie danych do treści pandasStreaming | |
Ze Spark | Ładowanie danych do treści pandasStreaming | ||
R | Dystrybucja Anaconda R | Ładuj dane w obiekcie rRaw | |
Ze Spark | Ładowanie danych w obiekcie rData | ||
Pliki graficzne JPEG, PNG | |||
Python | Dystrybucja Anaconda Python | Ładowanie danych do treści pandasStreaming | |
Ze Spark | Ładowanie danych do treści pandasStreaming | ||
Za pomocą komendy Hadoop | Ładowanie danych do treści pandasStreaming | ||
R | Dystrybucja Anaconda R | Ładuj dane w obiekcie rRaw | |
Ze Spark | Ładowanie danych w obiekcie rData | ||
Za pomocą komendy Hadoop | Ładowanie danych w obiekcie rData | ||
Pliki binarne | |||
Python | Dystrybucja Anaconda Python | Ładowanie danych do treści pandasStreaming | |
Ze Spark | Ładowanie danych do treści pandasStreaming | ||
Hadoop | Brak obsługi ładowania danych | ||
R | Dystrybucja Anaconda R | Ładuj dane w obiekcie rRaw | |
Ze Spark | Ładuj dane do obiektu rRaw | ||
Hadoop | Ładowanie danych w obiekcie rData |
Obsługiwane połączenia z bazą danych
Źródło danych | Język kodowania notatnika | Typ mechanizmu obliczeniowego | Dostępne wsparcie dla ładowania danych |
---|---|---|---|
- Db2 Warehouse on Cloud - IBM Db2 on Cloud - Baza danychIBM Db2 Database |
|||
Python | Dystrybucja Anaconda Python | Ładowanie danych do systemów ibmdbpyIda i ibmdbpyPandas | |
Ze Spark | Ładowanie danych do systemu ibmdbpyIda, ibmdbpyPandas i sparkSessionDataFrame | ||
Za pomocą komendy Hadoop | Ładowanie danych do systemu ibmdbpyIda, ibmdbpyPandas i sparkSessionDataFrame | ||
R | Dystrybucja Anaconda R | Ładowanie danych do plików ibmdbrIda i ibmdbrDataframe | |
Ze Spark | Ładowanie danych do ramek ibmdbrIda, ibmdbrDatai sparkSessionDataFrame | ||
Za pomocą komendy Hadoop | Ładowanie danych do ramek ibmdbrIda, ibmdbrDatai sparkSessionDataFrame | ||
- Db2 for z/OS |
|||
Python | Dystrybucja Anaconda Python | Ładowanie danych do systemów ibmdbpyIda i ibmdbpyPandas | |
Ze Spark | Brak obsługi ładowania danych | ||
- Amazon Simple Storage Services (S3) - Amazon Simple Storage Services (S3) z polityką dostępu IAM |
|||
Python | Dystrybucja Anaconda Python | Ładowanie danych do treści pandasStreaming | |
Za pomocą komendy Hadoop | Ładowanie danych do treści pandasStreamingBody i sparkSessionSetup | ||
R | Anaconda R distributuion | Ładuj dane do obiektu rRaw | |
Za pomocą komendy Hadoop | Ładowanie danych do obiektów rRawi konfiguracji sparkSession | ||
- IBM Cloud Databases for PostgreSQL - Microsoft SQL Server |
|||
Python | Dystrybucja Anaconda Python | Ładowanie danych do ramki pandasData | |
Ze Spark | Ładowanie danych do ramki pandasData | ||
R | Dystrybucja Anaconda R | Ładowanie danych do ramki danych R | |
Ze Spark | Ładowanie danych do ramki danych R i sparkSessionDataFrame | ||
Python | Dystrybucja Anaconda Python | Załaduj dane do ramki pandasData W wygenerowanym kodzie: -Edytuj parametr ścieżki w ostatnim wierszu kodu -Usuń znaczniki komentarza Aby odczytać dane, patrz Odczytywanie danych ze źródła danych Aby wyszukać dane, patrz Wyszukiwanie obiektów danych W celu zapisania danych patrz Zapisywanie danych w źródle danych . |
|
Ze Spark | Brak obsługi ładowania danych | ||
R | Dystrybucja Anaconda R | Załaduj dane do ramki danych R W wygenerowanym kodzie: -Edytuj parametr ścieżki w ostatnim wierszu kodu -Usuń znaczniki komentarza W celu odczytania danych, Patrz sekcja Odczytywanie danych ze źródła danych W celu wyszukania danych patrz sekcja Wyszukiwanie obiektów danych W celu zapisania danych zapoznaj się z sekcji Zapis danych do źródła danych . |
|
Ze Spark | Brak obsługi ładowania danych | ||
Python | Dystrybucja Anaconda Python | Ładowanie danych do ramki pandasData | |
Ze Spark | Ładowanie danych do ramki pandasData | ||
R | Dystrybucja Anaconda R | Brak obsługi ładowania danych | |
Ze Spark | Brak obsługi ładowania danych | ||
- Amazon RDS for MySQL |
|||
Python | Dystrybucja Anaconda Python | Ładowanie danych do ramki pandasData | |
Ze Spark | Ładowanie danych do ramki pandasData | ||
R | Dystrybucja Anaconda R | Ładowanie danych do ramki danych R i sparkSessionDataFrame | |
Ze Spark | Brak obsługi ładowania danych | ||
- HTTP - Apache Cassandra - Amazon RDS for PostgreSQL |
|||
Python | Dystrybucja Anaconda Python | Ładowanie danych do ramki pandasData | |
Ze Spark | Ładowanie danych do ramki pandasData | ||
R | Dystrybucja Anaconda R | Ładowanie danych do ramki danych R | |
Ze Spark | Ładowanie danych do ramki danych R |
Temat nadrzędny: Ładowanie i uzyskiwanie dostępu do danych w notatniku