Translation not up to date
Dane można zintegrować z notatnikami, uzyskując dostęp do danych z pliku lokalnego, z wolnych zestawów danych lub z połączenia ze źródłem danych. Dane te są ładowane do struktury danych lub kontenera w notatniku, na przykład pandas.DataFrame, numpy.array, Spark RDD lub Spark DataFrame.
Aby pracować z danymi w notatniku, można wybrać jedną z następujących opcji:
Opcja | Zalecana metoda | Wymagania | Szczegóły |
---|---|---|---|
Dodawanie danych z pliku z systemu lokalnego | Użyj wygenerowanego kodu dla wybranego źródła danych, klikając ikonę Fragmenty kodu () na pasku narzędzi i klikając opcję Odczytaj dane . | Plik musi istnieć jako zasób aplikacyjny projektu | Dodaj plik z systemu lokalnego |
Dodaj dane z wolnego zestawu danych z przykładów | Użyj wygenerowanego kodu dla wybranego źródła danych, klikając ikonę Fragmenty kodu () na pasku narzędzi i klikając opcję Odczytaj dane . | Zestaw danych (plik) musi istnieć jako zasób aplikacyjny projektu | Użyj wolnego zestawu danych z przykładów |
Załaduj dane z połączeń źródła danych | Użyj wygenerowanego kodu dla wybranego źródła danych, klikając ikonę Fragmenty kodu () na pasku narzędzi i klikając opcję Odczytaj dane . | Połączenia muszą istnieć jako zasoby aplikacyjne projektu | Ładowanie danych z połączenia źródła danych |
Programowy dostęp do zasobów aplikacyjnych i metadanych projektu | Użycie ibm-watson-studio-lib |
Źródła danych muszą istnieć jako zasoby aplikacyjne projektu | Korzystanie z biblioteki ibm-watson-studio-lib do interakcji z zasobami danych |
Tworzenie i używanie danych składnicy składników | Korzystanie z funkcji bibliotecznych systemu assetframe-lib |
Zasoby danych muszą istnieć jako zasoby aplikacyjne w projekcie | Biblioteka assetframe-lib dla języka Python umożliwia tworzenie i używanie danych składnicy składników |
Dostęp do danych za pomocą funkcji API lub komendy systemu operacyjnego | Na przykład użycie składni Wget |
Nd. | Dostęp do danych za pomocą funkcji API lub komendy systemu operacyjnego |
Załaduj dane z plików lokalnych
Aby uzyskać dostęp do danych z pliku lokalnego, można załadować plik z notatnika lub najpierw załadować plik do projektu. W notatniku można dodać automatycznie wygenerowany kod, aby uzyskać dostęp do danych, klikając ikonę Fragmenty kodu (), a następnie klikając opcję Odczytaj dane. Wygenerowany kod służy do szybkiego rozpoczęcia pracy z zestawami danych.
Kod jest generowany dla typów plików, takich jak CSV, JSON i XLSX. Aby dowiedzieć się, które struktury danych są generowane dla danego języka notatnika, należy zapoznać się z sekcją Obsługa ładowania danych. W przypadku typów plików, dla których generowanie kodu nie jest obsługiwane, można wstawić tylko referencje pliku. Korzystając z referencji, można napisać własny kod ładujący dane pliku do DataFrame lub innej struktury danych w komórce notatnika.
Aby dodać plik z systemu lokalnego do notatnika:
- Otwórz notatnik w trybie edycji, kliknij ikonę Prześlij zasób aplikacyjny do projektu () na pasku narzędzi, a następnie przejrzyj plik danych lub przeciągnij go na pasek boczny notatnika.
- Kliknij ikonę Fragmenty kodu (), kliknij opcję Odczytaj dane , a następnie wybierz plik danych z projektu. Użyj ikony ołówka, aby wybrać inny plik danych.
- Z listy rozwijanej Ładuj jako wybierz preferowaną opcję ładowania.
- Kliknij pustą komórkę kodu w notatniku, a następnie kliknij, aby wstawić wygenerowany kod. Można również kliknąć, aby skopiować wygenerowany kod do schowka, a następnie wkleić go do notatnika.
Aby ręcznie dodać referencje pliku i zapisać kod dla metody dostępu do pliku i DataFrame :
- Dodaj plik do obiektowej pamięci masowej, klikając ikonę Prześlij zasób aplikacyjny do projektu (), a następnie przeglądając plik danych lub przeciągając go na pasek boczny notatnika.
- Kliknij ikonę Fragmenty kodu (), a następnie kliknij opcję Odczytaj dane.
- Kliknij pustą komórkę kodu w notatniku, wybierz opcję ładowania Referencje, a następnie załaduj referencje do komórki. Można również kliknąć, aby skopiować referencje do schowka, a następnie wkleić je do notatnika.
- Aby uzyskać dostęp do danych w notatniku, należy wstawić referencje do odpowiedniej metody dla danego języka notatnika. Na przykład ten kod można znaleźć w blogu Python.
- Aby załadować dane do DataFrame lub innej struktury danych, należy odwołać się do metody dostępu do danych w odpowiedniej dla danego języka metodzie odczytu.
Załaduj zestawy danych z przykładów
Zestawy danych w próbkach zawierają otwarte dane. Obejrzyj ten krótki film wideo, aby zobaczyć, jak pracować z publicznymi zestawami danych w przykładach.
Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.
Aby dodać zestaw danych z przykładów w notatniku, należy skopiować zestaw danych do projektu:
- Z menu nawigacyjnego IBM watsonx wybierz opcję Przykłady.
- Znajdź kartę dla zestawu danych, który chcesz dodać.
- Kliknij opcję Dodaj do projektu, wybierz projekt i kliknij przycisk Dodaj. Kliknięcie opcji Wyświetl projekt powoduje przejście do strony przeglądu projektu. Zasób danych zostanie dodany do listy zasobów danych na stronie Zasoby projektu.
- Otwórz notatnik w trybie edycji, kliknij ikonę Fragmenty kodu () na pasku narzędzi, kliknij opcję Odczytaj dane , a następnie wybierz zasób danych z projektu.
- Z listy rozwijanej Ładuj jako wybierz preferowaną opcję ładowania.
- Kliknij pustą komórkę kodu w notatniku, a następnie kliknij, aby wstawić wygenerowany kod. Można również kliknąć, aby skopiować wygenerowany kod do schowka, a następnie wkleić go do notatnika. Wygenerowany kod służy jako szybki start do rozpoczęcia pracy z zestawem danych lub połączeniem. W przypadku systemów produkcyjnych należy uważnie przejrzeć wstawiony kod, aby określić, czy należy napisać własny kod, który lepiej odpowiada potrzebom użytkownika.
Załaduj dane z połączeń źródła danych
Przed załadowaniem danych z usługi danych IBM lub z zewnętrznego źródła danych należy utworzyć lub dodać połączenie do projektu. Patrz sekcja Dodawanie połączeń do projektów.
Użytkownik dodaje automatycznie wygenerowany kod w celu załadowania danych z połączeń z bazą danych, klikając ikonę Fragmenty kodu () na pasku narzędzi notatnika, a następnie klikając opcję Odczytaj dane. Aby dowiedzieć się, które połączenia z bazą danych są obsługiwane, należy zapoznać się z sekcją Obsługa ładowania danych. W przypadku nieobsługiwanych połączeń z bazą danych można wstawić tylko referencje połączenia z bazą danych. Korzystając z referencji, można napisać własny kod ładujący dane do DataFrame lub innej struktury danych w komórce notatnika.
Aby załadować dane z istniejącego połączenia ze źródłem danych do struktury danych w notatniku:
- Otwórz notatnik w trybie edycji, kliknij ikonę Fragmenty kodu () na pasku narzędzi, kliknij opcję Odczytaj dane , a następnie wybierz połączenie ze źródłem danych z projektu. Użyj ikony ołówka, aby wybrać inne połączenie.
- Wybierz schemat i tabelę. Aby zmienić wybór, użyj ikony ołówka.
- Wybierz opcję ładowania. Jeśli po wybraniu schematu i tabeli zostaną wybrane referencje, a nie opcja ładowania danych, zostaną wygenerowane tylko metadane.
- Kliknij pustą komórkę kodu w notatniku, a następnie wstaw kod do komórki. Można również kliknąć, aby skopiować wygenerowany kod do schowka, a następnie wkleić go do notatnika. Wygenerowany kod służy jako szybki start do rozpoczęcia pracy z zestawem danych lub połączeniem. W przypadku systemów produkcyjnych należy uważnie przejrzeć wstawiony kod, aby określić, czy należy napisać własny kod, który lepiej odpowiada potrzebom użytkownika.
- W razie potrzeby wprowadź swoje osobiste referencje dla zablokowanych połączeń danych, które są oznaczone ikoną klucza (). Jest to jednorazowy krok, który trwale odblokowuje połączenie. Po odblokowaniu połączenia ikona klucza nie jest już wyświetlana. Patrz sekcja Dodawanie połączeń do projektów.
- Jeśli nie można wygenerować kodu dla połączenia, załaduj referencje i otwórz połączenie z bazą danych, które odwołuje się do referencji. Napisz kod, aby załadować dane.
Użyj funkcji API lub komendy systemu operacyjnego, aby uzyskać dostęp do danych
Aby uzyskać dostęp do danych, można użyć funkcji API lub komend systemu operacyjnego w notatniku, na przykład komendy Wget
w celu uzyskania dostępu do danych za pomocą protokołów HTTP, HTTPS lub FTP. Jeśli używane są te typy funkcji i komend interfejsu API, należy dołączyć kod, który ustawia znacznik dostępu projektu. Więcej informacji na ten temat zawiera sekcja Ręczne dodawanie znacznika dostępu do projektu.
Więcej inform.
Biblioteka ibm-watson-studio-lib służy do programowej interakcji z zasobami aplikacyjnymi projektu. Biblioteka
ibm-watson-studio-lib
jest następcą bibliotekiproject-lib
. Aby przejść z programuproject-lib
do programuibm-watson-studio-lib
, należy zapoznać się z następującymi informacjami:
Temat nadrzędny: Notatniki i skrypty