0 / 0
Go back to the English version of the documentation
RStudio
Last updated: 26 lip 2023
RStudio

R to popularna analiza statystyczna i pakiet uczenia maszynowego, który umożliwia zarządzanie danymi i obejmuje testy, modele, analizy i grafikę. Produkt RStudio, dołączony do produktu IBM Watson Studio, udostępnia zintegrowane środowisko programistyczne do pracy ze skryptami R.

Dostęp do produktu RStudio

Program RStudio jest zintegrowany z projektami IBM Watson Studio i może zostać uruchomiony po utworzeniu projektu. Integracja z produktem RStudio w projektach umożliwia dostęp do plików danych zapisanych w zasobniku IBM Cloud Object Storage powiązanym z projektem w programie RStudio i korzystanie z nich.

Aby uruchomić produkt RStudio w projekcie:

  1. Kliknij opcję RStudio w menu Uruchom środowisko IDE na pasku działań projektu.

  2. Wybierz środowisko.

  3. Kliknij przycisk Uruchom.

    Środowisko wykonawcze środowiska zostanie zainicjowane, a środowisko programistyczne zostanie otwarte.

Czasami podczas uruchamiania sesji produktu RStudio może wystąpić uszkodzenie stanu produktu RStudio z poprzedniej sesji, a sesja nie zostanie uruchomiona. W takim przypadku należy wybrać opcję resetowania obszaru roboczego w momencie wybrania środowiska RStudio, a następnie ponownie uruchomić środowisko IDE produktu RStudio. Po zresetowaniu obszaru roboczego program RStudio jest uruchamiany przy użyciu ustawień domyślnych z czystym obszarem roboczym RStudio.

Praca z plikami danych

W produkcie RStudio można pracować z plikami danych z różnych źródeł:

  • Pliki w strukturze plików serwera RStudio, którą można wyświetlić, klikając opcję Pliki w prawej dolnej sekcji produktu RStudio. W tym miejscu można tworzyć foldery, przesyłać pliki z systemu lokalnego i usuwać pliki.

    Aby uzyskać dostęp do tych plików w R, należy ustawić katalog roboczy na katalog z plikami. W tym celu należy przejść do katalogu, w którym znajdują się pliki, a następnie kliknąć opcję Więcej > Ustaw jako katalog roboczy.

    Należy pamiętać, że pliki zapisane w katalogu Home instancji produktu RStudio są trwałe tylko w obrębie instancji użytkownika i nie mogą być współużytkowane w różnych środowiskach ani w projekcie.

    Zastrzeżenie wideo: Niektóre drobne kroki i elementy graficzne znajdujące się na tej stronie mogą różnić się w zależności od wdrożenia.

    Obejrzyj ten film wideo, aby zobaczyć, jak załadować dane do produktu RStudio.

    Ten film wideo udostępnia metodę wizualną, która umożliwia poznanie pojęć i zadań w tej dokumentacji.

  • Zasoby danych projektu , które są przechowywane w zasobniku IBM Cloud Object Storage powiązanym z danym projektem. Po uruchomieniu produktu RStudio zawartość zasobnika IBM Cloud Object Storage jest podłączana do katalogu project-objectstorage w katalogu Home produktu RStudio.

    Jeśli pliki danych mają być wyświetlane w katalogu project-objectstorage , należy dodać je jako zasoby aplikacyjne do projektu. Patrz sekcja Dodawanie plików jako zasobów aplikacyjnych projektu.

    Jeśli nowe zasoby danych zostaną dodane do projektu w czasie, gdy użytkownik znajduje się w produkcie RStudio, a użytkownik chce uzyskać do nich dostęp, należy odświeżyć folder project-objectstorage .

    Informacje na temat odczytu i zapisu danych do i z Cloud Object Storage.

  • Dane przechowywane w systemie bazy danych.

    Obejrzyj ten film wideo, aby zobaczyć, jak połączyć się z zewnętrznymi źródłami danych w produkcie RStudio.

    Ten film wideo udostępnia metodę wizualną, która umożliwia poznanie pojęć i zadań w tej dokumentacji.

  • Pliki zapisane w lokalnej pamięci masowej , które są podłączone do produktu /home/rstudio. Katalog home ma ograniczenie pamięci masowej o wielkości 2 GB i jest używany do przechowywania obszaru roboczego sesji RStudio. Należy zauważyć, że dla pamięci masowej katalogu home przydzielono 2 GB pamięci masowej w ramach wszystkich projektów, niezależnie od tego, czy w każdym projekcie używany jest produkt RStudio. W związku z tym w katalogu home powinny być przechowywane tylko pliki skryptowe R i małe pliki danych. Nie jest on przeznaczony dla dużych zbiorów danych ani dużych wygenerowanych danych wyjściowych. Wszystkie duże pliki danych powinny być przesyłane jako zasoby aplikacyjne projektu, które są podłączone do katalogu project-objectstorage , z którego można uzyskać do nich dostęp.

Dodawanie plików jako zasobów aplikacyjnych projektu

Jeśli pracowałeś z plikami danych i chcesz, aby były one wyświetlane w katalogu project-objectstorage , musisz dodać je do projektu jako zasoby danych. Aby dodać te pliki jako zasoby danych do projektu:

  1. Na stronie Zasoby projektu kliknij ikonę Prześlij zasób aplikacyjny do projektu (Wyświetla ikonę Prześlij zasób aplikacyjny do projektu), a następnie wybierz kartę Pliki .
  2. Wybierz pliki, które mają zostać dodane do projektu jako zasoby aplikacyjne.
  3. Z listy Actions (Działania) wybierz opcję Add as data asset (Dodaj jako zasób danych) i zastosuj zmiany.

Wykorzystanie mocy obliczeniowej i zakres czasu wykonywania

Środowisko wykonawcze środowiska RStudio zawsze jest ograniczone do szablonu środowiska i użytkownika sesji RStudio. Tylko jedna sesja RStudio może być jednocześnie aktywna przez użytkownika Watson Studio . Jeśli program RStudio został uruchomiony w innym projekcie, zostanie wyświetlone pytanie o to, czy zatrzymać sesję i uruchomić nową sesję RStudio w kontekście bieżącego projektu, w którym pracujesz.

Użycie środowiska wykonawczego jest obliczane przez liczbę godzin jednostki mocy obliczeniowej (CUHs) zajętych przez środowisko wykonawcze aktywnego środowiska. Jednostki CUHs wykorzystywane przez aktywne środowisko wykonawcze RStudio w projekcie są fakturowane na konto twórcy projektu. Patrz: Jednostki mocy obliczeniowej na godzinę dla produktu RStudio.

Można sprawdzić, które środowiska wykonawcze środowiska RStudio są aktywne na stronie Środowiska projektu. Z poziomu tej strony można zatrzymać środowisko wykonawcze.

Pamiętaj: Licznik CUH nadal rośnie, gdy środowisko wykonawcze jest aktywne, więc zatrzymaj środowisko wykonawcze, jeśli nie jest używany produkt RStudio. Jeśli środowisko wykonawcze nie zostanie jawnie zatrzymane, zostanie on zatrzymany po bezczynnej godzinie 2 godziny. W czasie tej bezczynności użytkownik będzie kontynuował korzystanie z jednostek CUHs, dla których zostały zafakturoone. Długotrwałe intensywne prace są trudne do zatrzymania po 24 godzinach.

Obejrzyj ten film wideo, aby zapoznać się z przeglądem środowiska IDE produktu RStudio.

Zastrzeżenie wideo: Niektóre drobne kroki i elementy graficzne w tym filmie wideo mogą się różnić od używanej platformy.

Ten film wideo udostępnia metodę wizualną, która umożliwia poznanie pojęć i zadań w tej dokumentacji.

  • Zapis wideo
    Czas Transkrypcja
    00:00 Ten film wideo to szybka prezentacja zintegrowanego środowiska programistycznego produktu RStudio w ramach projektu Watson Studio .
    00:07 Z dowolnego projektu można uruchomić środowisko IDE produktu RStudio.
    00:12 RStudio to darmowe i otwarte zintegrowane środowisko programistyczne dla R, język programowania do obliczeń statystycznych i graficznych.
    00:22 W produkcie RStudio znajdują się cztery panele: panel źródłowy, panel konsoli, panel środowiska oraz panel plików.
    00:32 Panele pomagają w organizowaniu pracy i rozdzielaniu różnych zadań, które wykonujesz z R.
    00:39 Aby zminimalizować i zmaksymalizować panel, można zmienić wielkość panelu lub użyć ikon.
    00:47 Istnieje również możliwość zmiany rozmieszczenia paneli w opcjach globalnych.
    00:53 Panel konsoli jest interfejsem użytkownika R.
    00:56 To jest dokładnie to, co można zobaczyć w oknie terminala lub interfejsy użytkownika w pakiecie z R.
    01:01 Panel konsoli ma pewne dodane funkcje, które mogą być przydatne.
    01:06 Aby uruchomić kod z konsoli, wystarczy wpisać komendę.
    01:11 Rozpocznij wpisywanie komendy, aby wyświetlić listę komend, których nazwy rozpoczynają się od wpisanych liter.
    01:17 Podświetl komendę na liście i naciśnij klawisz "Enter", aby ją wstawić.
    01:24 Użyj strzałki w górę, aby przewinąć komendy, które zostały wprowadzone wcześniej.
    01:31 Po wydaniu większej liczby komend możliwe jest przewijanie wyników.
    01:36 Aby wyczyścić konsolę, należy użyć opcji menu.
    01:39 Można również użyć funkcji uzupełniania tabulacji, aby wyświetlić listę funkcji, obiektów i zestawów danych, które rozpoczynają się od tego tekstu.
    01:47 Aby wyświetlić pomoc dla tej komendy, użyj strzałek, aby podświetlić komendę.
    01:51 Gdy jesteś gotowy, naciśnij "Enter", aby go wstawić.
    01:55 Następnie zostanie wyświetlona lista opcji dla tej komendy w bieżącym kontekście.
    01:59 Na przykład pierwszym argumentem dla funkcji read.csv jest plik.
    02:05 Program RStudio wyświetli listę folderów i plików znajdujących się w katalogu roboczym, dzięki czemu można łatwo znaleźć plik, który ma być dołączany do argumentu.
    02:16 Na koniec, jeśli użytkownik korzysta z funkcji uzupełniania tabulacji z funkcją, która oczekuje nazwy pakietu, takiej jak biblioteka, zostanie wyświetlona lista wszystkich zainstalowanych pakietów.
    02:28 Następnie, spójrzmy na panel źródłowy, który jest po prostu edytorem tekstu, aby napisać swój kod R.
    02:34 Edytor tekstu obsługuje pliki komend R i zwykły tekst, a także kilka innych języków i zawiera podświetlenie specyficzne dla języka w kontekście.
    02:47 W edytorze tekstu można również zauważyć, że uzupełnianie kart jest również dostępne.
    02:53 Za pomocą edytora tekstu można uruchomić jeden wiersz kodu lub wybrać kilka wierszy kodu do uruchomienia, a wyniki zostaną wyświetlone w panelu konsoli.
    03:08 Kod można zapisać jako skrypt R w celu współużytkowania lub ponownego uruchomienia w późniejszym czasie.
    03:15 Funkcja wyświetlania otwiera nową kartę, która pokazuje ramkę danych w formacie arkusza kalkulacyjnego.
    03:22 Można też wyświetlać je w osobnym oknie.
    03:25 Teraz można przewijać dane, sortować kolumny, wyszukiwać konkretne wartości lub filtrować wiersze za pomocą suwaków i rozwijanych menu.
    03:41 Panel środowiska zawiera kartę "Environment" (Środowisko), kartę "History" (Historia) i "Connections" (Połączenia), a także śledzi, co działo się w tej sesji R.
    03:51 Zakładka "Środowisko" zawiera obiekty R, które istnieją w Twoim środowisku globalnym, utworzone podczas sesji.
    03:58 Tak więc podczas tworzenia nowego obiektu w panelu konsoli jest on automatycznie wyświetlany w panelu środowiska.
    04:04 Można również wyświetlić obiekty związane z konkretnym pakietem, a nawet wyświetlić kod źródłowy dla konkretnej funkcji.
    04:12 Można również wyświetlić listę zestawów danych, rozwinąć zestaw danych, aby sprawdzić jego poszczególne elementy, a następnie wyświetlić je w panelu źródłowym.
    04:22 Zawartość środowiska można zapisać jako plik .RData, aby można było załadować ten plik .RData w późniejszym terminie.
    04:29 W tym miejscu można również wyczyścić obiekty z obszaru roboczego.
    04:33 Jeśli chcesz usunąć określone elementy, użyj widoku siatki.
    04:38 Na przykład, można łatwo znaleźć duże elementy do usunięcia, aby zwolnić pamięć w sesji R.
    04:45 Zakładka "Środowisko" umożliwia również import zestawu danych.
    04:50 Przed zakończeniem importowania można wyświetlić podgląd zestawu danych i opcji zmian.
    04:55 Zaimportowane dane zostaną wyświetlone w panelu źródłowym.
    05:00 Na karcie "Historia" wyświetlana jest historia każdej z komend uruchamianych w wierszu komend.
    05:05 Podobnie jak w zakładce "Środowisko", można zapisać historię jako plik. Rhistory, dzięki czemu można go otworzyć w późniejszym terminie.
    05:11 A ta karta ma te same opcje, aby wyczyścić całą historię i poszczególne wpisy w historii.
    05:17 Wybierz komendę i wyślij ją do konsoli, aby ponownie uruchomić komendę.
    05:23 Można również skopiować komendę do panelu źródłowego w celu uwzględnienia go w skrypcie.
    05:31 Na karcie "Połączenia" można utworzyć nowe połączenie ze źródłem danych.
    05:36 Opcje w tym oknie dialogowym są zależne od zainstalowanych pakietów.
    05:41 Na przykład połączenie "BLUDB" umożliwia połączenie się z usługą Db2 Warehouse on Cloud .
    05:49 Panel plików zawiera karty "Pliki", "Ppartie", "Pakiety", "Pomoc" i "Przeglądarka".
    05:55 Na karcie "Pliki" wyświetlana jest zawartość katalogu roboczego.
    05:59 Program RStudio będzie ładował pliki z tego katalogu i zapisywać pliki w tym katalogu.
    06:04 Przejdź do pliku i kliknij ten plik, aby wyświetlić go w panelu źródłowym.
    06:09 W tym miejscu można tworzyć nowe foldery i przesyłać pliki, wybierając pojedyncze pliki do przesłania lub wybierając plik .zip zawierający wszystkie pliki do przesłania.
    06:25 W tym miejscu można także usuwać i zmieniać nazwy plików i folderów.
    06:30 Aby uzyskać dostęp do pliku w R, należy ustawić folder danych jako katalog roboczy.
    06:36 Zobaczysz, że komenda setwd została wykonana w konsoli.
    06:43 Dostęp do zasobów danych w projekcie można uzyskać, otwierając folder projektu.
    06:50 Na karcie "Ploty" wyświetlane są wyniki funkcji wykresu R, takich jak: wykres, hist, ggplot i xyplot.
    07:00 Za pomocą strzałek lub powiększ można przechodzić przez różne wykresy, aby zobaczyć pełny ekran wykresu.
    07:09 Można również usunąć poszczególne wykresy lub wszystkie wykresy.
    07:13 Użyj opcji "Eksportuj", aby zapisać wykres jako plik graficzny lub drukarski w określonej rozdzielczości.
    07:21 Na karcie "Pakiety" są wyświetlane pakiety, które są obecnie zainstalowane w bibliotece systemowej.
    07:26 Pasek wyszukiwania umożliwia szybkie znalezienie konkretnego pakietu.
    07:30 Sprawdzane pakiety to pakiety, które zostały już załadowane, za pomocą komendy biblioteki, w bieżącej sesji.
    07:38 Istnieje możliwość sprawdzenia dodatkowych pakietów z tego miejsca, aby je załadować lub usunąć zaznaczenie pakietów w celu ich odłączenia od bieżącej sesji.
    07:45 W panelu konsoli zostaną wyświetlone wyniki.
    07:48 Użyj znaku "X" obok nazwy pakietu, aby usunąć go z biblioteki systemowej.
    07:54 Można również znaleźć nowe pakiety do zainstalowania lub zaktualizowania do najnowszej wersji dowolnego pakietu.
    08:03 Kliknięcie dowolnego z pakietów spowoduje otwarcie karty "Pomoc" wraz z dodatkowymi informacjami dla tego pakietu.
    08:09 W tym miejscu można wyszukać funkcje, aby uzyskać więcej pomocy.
    08:13 Z poziomu konsoli można użyć komendy help lub po prostu wpisać znak zapytania, po którym następuje funkcja, aby uzyskać pomoc dla tej funkcji.
    08:21 Na karcie "Viewer" wyświetlane są dane wyjściowe HTML.
    08:25 Niektóre funkcje R generują kod HTML w celu wyświetlania raportów i wykresów interaktywnych.
    08:31 Pakiet R Markdown tworzy raporty, które można wyświetlić w zakładce "Przeglądarka".
    08:38 Pakiet Shiny tworzy aplikacje webowe, które możesz przeglądać w zakładce "Przeglądarka".
    08:44 I inne pakiety budują na środowisku htmlwidgety i zawierają oparte na Java, interaktywne wizualizacje.
    08:54 Można również opublikować wizualizację w serwisie, pod nazwą "RPubs.com".
    09:01 Jest to krótki przegląd środowiska IDE produktu RStudio.
    09:05 Znajdź więcej filmów wideo w produkcie RStudio w dokumentacji Cloud Pak for Data as a Service .

Więcej inform.

Temat nadrzędny: Notebooki i skrypty

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more