0 / 0
Go back to the English version of the documentation
Ładowanie i uzyskiwanie dostępu do danych w notatniku
Last updated: 14 lis 2023
Ładowanie i uzyskiwanie dostępu do danych w notatniku

Dane można zintegrować z notatnikami, uzyskując dostęp do danych z pliku lokalnego, z wolnych zestawów danych lub z połączenia ze źródłem danych. Dane te są ładowane do struktury danych lub kontenera w notatniku, na przykład pandas.DataFrame, numpy.array, Spark RDD lub Spark DataFrame.

Aby pracować z danymi w notatniku, można wybrać jedną z następujących opcji:

Opcja Zalecana metoda Wymagania Szczegóły
Dodawanie danych z pliku z systemu lokalnego Użyj wygenerowanego kodu dla wybranego źródła danych, klikając ikonę Fragmenty kodu (Ikona fragmentów kodu) na pasku narzędzi i klikając opcję Odczytaj dane . Plik musi istnieć jako zasób aplikacyjny projektu Dodaj plik z systemu lokalnego
Dodaj dane z wolnego zestawu danych z przykładów Użyj wygenerowanego kodu dla wybranego źródła danych, klikając ikonę Fragmenty kodu (Ikona fragmentów kodu) na pasku narzędzi i klikając opcję Odczytaj dane . Zestaw danych (plik) musi istnieć jako zasób aplikacyjny projektu Użyj wolnego zestawu danych z przykładów
Załaduj dane z połączeń źródła danych Użyj wygenerowanego kodu dla wybranego źródła danych, klikając ikonę Fragmenty kodu (Ikona fragmentów kodu) na pasku narzędzi i klikając opcję Odczytaj dane . Połączenia muszą istnieć jako zasoby aplikacyjne projektu Ładowanie danych z połączenia źródła danych
Programowy dostęp do zasobów aplikacyjnych i metadanych projektu Użycie ibm-watson-studio-lib Źródła danych muszą istnieć jako zasoby aplikacyjne projektu Korzystanie z biblioteki ibm-watson-studio-lib do interakcji z zasobami danych
Tworzenie i używanie danych składnicy składników Korzystanie z funkcji bibliotecznych systemu assetframe-lib Zasoby danych muszą istnieć jako zasoby aplikacyjne w projekcie Biblioteka assetframe-lib dla języka Python umożliwia tworzenie i używanie danych składnicy składników
Dostęp do danych za pomocą funkcji API lub komendy systemu operacyjnego Na przykład użycie składni Wget Nd. Dostęp do danych za pomocą funkcji API lub komendy systemu operacyjnego
Ważne: Upewnij się, że w środowisku, w którym uruchomiony jest notatnik, jest wystarczająca ilość pamięci do zapisania danych załadowanych do notatnika. Środowisko musi mieć znacznie więcej pamięci niż łączna wielkość danych załadowanych do notatnika. Niektóre struktury danych, takie jak pandas, mogą przechowywać wiele kopii danych w pamięci.

Załaduj dane z plików lokalnych

Aby uzyskać dostęp do danych z pliku lokalnego, można załadować plik z notatnika lub najpierw załadować plik do projektu. W notatniku można dodać automatycznie wygenerowany kod, aby uzyskać dostęp do danych, klikając ikonę Fragmenty kodu (Ikona fragmentów kodu), a następnie klikając opcję Odczytaj dane. Wygenerowany kod służy do szybkiego rozpoczęcia pracy z zestawami danych.

Kod jest generowany dla typów plików, takich jak CSV, JSON i XLSX. Aby dowiedzieć się, które struktury danych są generowane dla danego języka notatnika, należy zapoznać się z sekcją Obsługa ładowania danych. W przypadku typów plików, dla których generowanie kodu nie jest obsługiwane, można wstawić tylko referencje pliku. Korzystając z referencji, można napisać własny kod ładujący dane pliku do DataFrame lub innej struktury danych w komórce notatnika.

Aby dodać plik z systemu lokalnego do notatnika:

  1. Otwórz notatnik w trybie edycji, kliknij ikonę Prześlij zasób aplikacyjny do projektu (Wyświetla ikonę Prześlij zasób aplikacyjny do projektu) na pasku narzędzi, a następnie przejrzyj plik danych lub przeciągnij go na pasek boczny notatnika.
  2. Kliknij ikonę Fragmenty kodu (Ikona fragmentów kodu), kliknij opcję Odczytaj dane , a następnie wybierz plik danych z projektu. Użyj ikony ołówka, aby wybrać inny plik danych.
  3. Z listy rozwijanej Ładuj jako wybierz preferowaną opcję ładowania.
  4. Kliknij pustą komórkę kodu w notatniku, a następnie kliknij, aby wstawić wygenerowany kod. Można również kliknąć, aby skopiować wygenerowany kod do schowka, a następnie wkleić go do notatnika.

Aby ręcznie dodać referencje pliku i zapisać kod dla metody dostępu do pliku i DataFrame :

  1. Dodaj plik do obiektowej pamięci masowej, klikając ikonę Prześlij zasób aplikacyjny do projektu (Wyświetla ikonę Prześlij zasób aplikacyjny do projektu), a następnie przeglądając plik danych lub przeciągając go na pasek boczny notatnika.
  2. Kliknij ikonę Fragmenty kodu (Ikona fragmentów kodu), a następnie kliknij opcję Odczytaj dane.
  3. Kliknij pustą komórkę kodu w notatniku, wybierz opcję ładowania Referencje, a następnie załaduj referencje do komórki. Można również kliknąć, aby skopiować referencje do schowka, a następnie wkleić je do notatnika.
  4. Aby uzyskać dostęp do danych w notatniku, należy wstawić referencje do odpowiedniej metody dla danego języka notatnika. Na przykład ten kod można znaleźć w blogu Python.
  5. Aby załadować dane do DataFrame lub innej struktury danych, należy odwołać się do metody dostępu do danych w odpowiedniej dla danego języka metodzie odczytu.

Załaduj zestawy danych z przykładów

Zestawy danych w próbkach zawierają otwarte dane. Obejrzyj ten krótki film wideo, aby zobaczyć, jak pracować z publicznymi zestawami danych w przykładach.

Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.


Aby dodać zestaw danych z przykładów w notatniku, należy skopiować zestaw danych do projektu:

  1. Z menu nawigacyjnego IBM watsonx wybierz opcję Przykłady.
  2. Znajdź kartę dla zestawu danych, który chcesz dodać. Widok zestawów danych
  3. Kliknij opcję Dodaj do projektu, wybierz projekt i kliknij przycisk Dodaj. Kliknięcie opcji Wyświetl projekt powoduje przejście do strony przeglądu projektu. Zasób danych zostanie dodany do listy zasobów danych na stronie Zasoby projektu.
  4. Otwórz notatnik w trybie edycji, kliknij ikonę Fragmenty kodu (Ikona fragmentów kodu) na pasku narzędzi, kliknij opcję Odczytaj dane , a następnie wybierz zasób danych z projektu.
  5. Z listy rozwijanej Ładuj jako wybierz preferowaną opcję ładowania.
  6. Kliknij pustą komórkę kodu w notatniku, a następnie kliknij, aby wstawić wygenerowany kod. Można również kliknąć, aby skopiować wygenerowany kod do schowka, a następnie wkleić go do notatnika. Wygenerowany kod służy jako szybki start do rozpoczęcia pracy z zestawem danych lub połączeniem. W przypadku systemów produkcyjnych należy uważnie przejrzeć wstawiony kod, aby określić, czy należy napisać własny kod, który lepiej odpowiada potrzebom użytkownika.

Załaduj dane z połączeń źródła danych

Przed załadowaniem danych z usługi danych IBM lub z zewnętrznego źródła danych należy utworzyć lub dodać połączenie do projektu. Patrz sekcja Dodawanie połączeń do projektów.

Użytkownik dodaje automatycznie wygenerowany kod w celu załadowania danych z połączeń z bazą danych, klikając ikonę Fragmenty kodu (Ikona fragmentów kodu) na pasku narzędzi notatnika, a następnie klikając opcję Odczytaj dane. Aby dowiedzieć się, które połączenia z bazą danych są obsługiwane, należy zapoznać się z sekcją Obsługa ładowania danych. W przypadku nieobsługiwanych połączeń z bazą danych można wstawić tylko referencje połączenia z bazą danych. Korzystając z referencji, można napisać własny kod ładujący dane do DataFrame lub innej struktury danych w komórce notatnika.

Aby załadować dane z istniejącego połączenia ze źródłem danych do struktury danych w notatniku:

  1. Otwórz notatnik w trybie edycji, kliknij ikonę Fragmenty kodu (Ikona fragmentów kodu) na pasku narzędzi, kliknij opcję Odczytaj dane , a następnie wybierz połączenie ze źródłem danych z projektu. Użyj ikony ołówka, aby wybrać inne połączenie.
  2. Wybierz schemat i tabelę. Aby zmienić wybór, użyj ikony ołówka.
  3. Wybierz opcję ładowania. Jeśli po wybraniu schematu i tabeli zostaną wybrane referencje, a nie opcja ładowania danych, zostaną wygenerowane tylko metadane.
  4. Kliknij pustą komórkę kodu w notatniku, a następnie wstaw kod do komórki. Można również kliknąć, aby skopiować wygenerowany kod do schowka, a następnie wkleić go do notatnika. Wygenerowany kod służy jako szybki start do rozpoczęcia pracy z zestawem danych lub połączeniem. W przypadku systemów produkcyjnych należy uważnie przejrzeć wstawiony kod, aby określić, czy należy napisać własny kod, który lepiej odpowiada potrzebom użytkownika.
  5. W razie potrzeby wprowadź swoje osobiste referencje dla zablokowanych połączeń danych, które są oznaczone ikoną klucza (symbol klucza dla połączeń z referencjami osobistymi). Jest to jednorazowy krok, który trwale odblokowuje połączenie. Po odblokowaniu połączenia ikona klucza nie jest już wyświetlana. Patrz sekcja Dodawanie połączeń do projektów.
  6. Jeśli nie można wygenerować kodu dla połączenia, załaduj referencje i otwórz połączenie z bazą danych, które odwołuje się do referencji. Napisz kod, aby załadować dane.

Użyj funkcji API lub komendy systemu operacyjnego, aby uzyskać dostęp do danych

Aby uzyskać dostęp do danych, można użyć funkcji API lub komend systemu operacyjnego w notatniku, na przykład komendy Wget w celu uzyskania dostępu do danych za pomocą protokołów HTTP, HTTPS lub FTP. Jeśli używane są te typy funkcji i komend interfejsu API, należy dołączyć kod, który ustawia znacznik dostępu projektu. Więcej informacji na ten temat zawiera sekcja Ręczne dodawanie znacznika dostępu do projektu.

Więcej inform.

Temat nadrzędny: Notatniki i skrypty

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more