R ist ein beliebtes Paket für statistische Analysen und maschinelles Lernen, das die Datenverwaltung ermöglicht und Tests, Modelle, Analysen und Grafiken umfasst. RStudio, das in IBM watsonx.ai Studio enthalten ist, bietet eine integrierte Entwicklungsumgebung für die Arbeit mit R-Skripten.
Nutzungshinweise und Einschränkungen
- RStudio ist in IBM watsonx.ai Studio-Projekte integriert. Sie können es starten, nachdem Sie ein Projekt erstellt haben.
- Sie können auf Datendateien zugreifen und diese verwenden, die im IBM Cloud Object Storage Bucket gespeichert sind, der mit Ihrem Projekt verknüpft ist.
- Sie können RStudio IDE verwenden, um Shiny-Anwendungen zu erstellen, aber Sie können sie nicht in Cloud Pak for Data as a Service bereitstellen.
Starten der RStudio
So starten Sie die RStudio IDE in Ihrem Projekt:
Klicken Sie im Menü IDE starten in der Aktionsleiste Ihres Projekts auf RStudio.
Wählen Sie eine Umgebung aus.
Klicken Sie auf Starten.
Die Umgebungslaufzeit wird initialisiert und die Entwicklungsumgebung wird geöffnet.
Wenn Sie Probleme beim Starten von RStudio haben, lesen Sie den Abschnitt Fehlerbehebung bei Problemen mit dem Starten von RStudio.
Fehlerbehebung bei Problemen beim Starten der RStudio IDE
Beim Starten von RStudio können die folgenden Probleme auftreten:
Korrumpierter RStudio aus einer vorherigen Sitzung
Problem: '
Wenn Sie eine RStudio starten, kann es vorkommen, dass der RStudio aus einer früheren Sitzung beschädigt ist und Ihre Sitzung nicht startet.
Lösung: '
Nach dem Start der RStudio wählen Sie in der Phase, in der Sie die RStudio auswählen, die Option Reset the workspace. RStudio wird mit den Standardeinstellungen und einem sauberen RStudio gestartet.
Mit Datendateien arbeiten
In RStudio können Sie mit Datendateien aus verschiedenen Quellen arbeiten:
Dateien in der Dateistruktur des RStudio-Servers, die Sie durch Klicken auf Dateien im rechten unteren Bereich von RStudio anzeigen können. In diesem Bereich können Sie Ordner erstellen, Dateien aus Ihrem lokalen System hochladen und Dateien löschen.
Um auf die Dateien in R zugreifen zu können, müssen Sie das Arbeitsverzeichnis auf das Verzeichnis festlegen, das die Dateien enthält. Navigieren Sie dazu zu dem Verzeichnis mit den Dateien und klicken Sie auf Mehr > Als Arbeitsverzeichnis festlegen.
Beachten Sie, dass Dateien, die im Verzeichnis
Home
Ihrer RStudio-Instanz gespeichert sind, nur in Ihrer Instanz persistent sind und nicht gemeinsam in mehreren Umgebungen genutzt werden können.Sehen Sie sich dieses Video an, um zu erfahren, wie Daten in RStudio geladen werden.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Projektdatenassets in dem IBM Cloud Object Storage-Bucket, das Ihrem Projekt zugeordnet ist. Beim Start von RStudio wird der Inhalt des IBM Cloud Object Storage-Buckets an das Verzeichnis
project-objectstorage
imHome
von RStudio angehängt.Wenn Datendateien im Verzeichnis
project-objectstorage
angezeigt werden sollen, müssen Sie sie als Assets zu Ihrem Projekt hinzufügen. Weitere Informationen finden Sie unter Dateien als Projektassets hinzufügen.Wenn neue Datenassets zum Projekt hinzugefügt werden, während Sie sich in RStudio befinden, und Sie auf diese Assets zugreifen möchten, müssen Sie den Ordner
project-objectstorage
aktualisieren.Weitere Informationen finden Sie unter Daten in Cloud Object Storage lesen und schreiben.
Daten, die in einem Datenbanksystem gespeichert sind.
In diesem Video erfahren Sie, wie Sie eine Verbindung zu externen Datenquellen in RStudio herstellen.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Im lokalen Speicher gespeicherte Dateien , die an
/home/rstudio
angehängt sind. Das Verzeichnis "home
hat eine Speicherbegrenzung von 2 GB und wird zum Speichern des RStudio verwendet. Beachten Sie, dass Sie 2 GB für Ihr 'home
für alle Ihre Projekte zugewiesen bekommen, unabhängig davon, ob Sie RStudio in jedem Projekt verwenden. Daher sollten Sie nur R-Scriptdateien und kleine Datendateien im Verzeichnishome
speichern. Sie ist nicht für große Datendateien oder große generierte Ausgaben gedacht. Alle großen Datendateien sollten als Projektassets hochgeladen werden, die an das Verzeichnisproject-objectstorage
angehängt sind, von wo aus Sie darauf zugreifen können.
Dateien als Projektassets hinzufügen
Wenn Sie möchten, dass Ihre Datendateien improject-objectstorage
Verzeichnis, müssen Sie sie Ihrem Projekt als Datenbestände hinzufügen. Gehen Sie wie folgt vor, um diese Dateien als Datenassets zum Projekt hinzuzufügen:
- Klicken Sie auf der Seite Assets des Projekts auf das Symbol Asset zum Projekt hochladen und wählen Sie die Registerkarte Dateien.
- Wählen Sie die Dateien aus, die Sie dem Projekt als Assets hinzufügen möchten.
- Wählen Sie in der Aktionsliste Als Datenasset hinzufügen aus und wenden Sie Ihre Änderungen an.
Kapazitätsverbrauch und Laufzeitbereich
Eine RStudio ist immer auf eine Umgebungsvorlage und einen RStudio beschränkt. Pro watsonx.ai Studio-Benutzer kann jeweils nur eine RStudio aktiv sein. Wenn Sie RStudio in einem anderen Projekt gestartet haben, werden Sie gefragt, ob Sie diese Sitzung stoppen und eine neue RStudio-Sitzung im Kontext des aktuell von Ihnen bearbeiteten Projekt starten möchten.
Die Laufzeitnutzung wird über die von der aktiven Umgebungslaufzeit verbrauchten Capacity-Unit-Stunden (CUH) berechnet. Die von einer aktiven RStudio-Laufzeit in einem Projekt verbrauchten Capacity-Unit-Stunden werden dem Konto des Projekterstellers in Rechnung gestellt. Weitere Informationen finden Sie unter Abrechnung für RStudio nach CUH.
Auf der Seite Umgebungen des Projekts können Sie sehen, welche RStudio-Umgebungslaufzeiten aktiv sind. Sie können Ihre Laufzeit auf dieser Seite stoppen.
Berücksichtigen Sie Folgendes: Der CUH-Zähler läuft weiter, solange die Laufzeit aktiv ist. Stoppen Sie die Laufzeit, wenn Sie RStudio nicht verwenden. Wenn Sie die Laufzeit nicht ausdrücklich stoppen, wird sie nach einer Leerlaufzeit von 2 Stunden für Sie gestoppt. Während der Dauer der Inaktivität werden weiterhin Capacity-Unit-Stunden verbraucht, die Ihnen in Rechnung gestellt werden. Lange rechenintensive Jobs werden nach 24 Stunden sofort gestoppt.
Dieses Video bietet eine Übersicht über die RStudio-IDE.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Videomitschrift Zeit Transkription 00:00 Dieses Video bietet einen kurzen Einblick in die integrierte Entwicklungsumgebung RStudio innerhalb eines Projekts. 00:07 Von jedem Projekt aus können Sie die RStudio starten. 00:12 RStudio ist eine freie und quelloffene integrierte Entwicklungsumgebung für R, eine Programmiersprache für statistische Berechnungen und Grafiken. 00:22 In RStudio gibt es vier Fenster: das Quellfenster, das Konsolenfenster, das Umgebungsfenster und das Datei-Fenster. 00:32 Die Teilfenster helfen Ihnen, Ihre Arbeit zu organisieren und die verschiedenen Aufgaben zu trennen, die Sie mit R ausführen werden. 00:39 Sie können die Größe der Teilfenster durch Ziehen ändern oder die Symbole verwenden, um ein Teilfenster zu minimieren und zu maximieren. 00:47 Sie können die Teilfenster auch in globalen Optionen neu anordnen. 00:53 Das Konsolenfenster ist Ihre Schnittstelle zu R. 00:56 Es ist genau das, was Sie in Terminal-Fenster oder Benutzerschnittstellen mit R gebündelt sehen würden. 01:01 Das Konsolenfenster enthält einige zusätzliche Funktionen, die Ihnen hilfreich sind. 01:06 Um Code über die Konsole auszuführen, geben Sie einfach den Befehl ein. 01:11 Beginnen Sie mit der Eingabe eines Befehls, um eine Liste der Befehle anzuzeigen, die mit den Buchstaben beginnen, die Sie eingegeben haben. 01:17 Markieren Sie einen Befehl in der Liste und drücken Sie die Eingabetaste, um ihn einzufügen. 01:24 Verwenden Sie den Aufwärtspfeil, um durch die zuvor eingegebenen Befehle zu blättern. 01:31 Wenn Sie weitere Befehle absetzen, können Sie durch die Ergebnisse blättern. 01:36 Verwenden Sie die Menüoption, um die Konsole zu löschen. 01:39 Sie können die Registerkartenvervollständigung auch verwenden, um eine Liste der Funktionen, Objekte und Datasets anzuzeigen, die mit diesem Text beginnen. 01:47 Verwenden Sie die Pfeile, um einen Befehl hervorzuheben und die Hilfe für diesen Befehl anzuzeigen. 01:51 Wenn Sie bereit sind, drücken Sie einfach "Enter", um es einzufügen. 01:55 Als Nächstes sehen Sie eine Liste der Optionen für diesen Befehl im aktuellen Kontext. 01:59 Das erste Argument für die Funktion read.csv ist beispielsweise die Datei. 02:05 RStudio zeigt eine Liste der Ordner und Dateien in Ihrem Arbeitsverzeichnis an, so dass Sie die Datei, die Sie mit dem Argument einschließen möchten, leicht finden können. 02:16 Wenn Sie die Registerkartenvervollständigung mit einer Funktion verwenden, die einen Paketnamen erwartet, z. B. eine Bibliothek, wird eine Liste aller installierten Pakete angezeigt. 02:28 Betrachten wir als Nächstes das Quellenteilfenster, das einfach ein Texteditor ist, in dem Sie Ihren R-Code schreiben können. 02:34 Der Texteditor unterstützt R-Befehlsdateien und einfachen Text sowie mehrere andere Sprachen und enthält sprachspezifische Hervorhebungen im Kontext. 02:47 Sie werden feststellen, dass die Vervollständigung der Registerkarte auch im Texteditor verfügbar ist. 02:53 Im Texteditor können Sie eine einzelne Codezeile ausführen oder mehrere auszuführende Codezeilen auswählen. Die Ergebnisse werden im Konsolenfenster angezeigt. 03:08 Sie können Ihren Code als R-Script speichern, um ihn gemeinsam zu nutzen oder später erneut auszuführen. 03:15 Die Ansichtsfunktion öffnet eine neue Registerkarte, auf der der Datenrahmen im Tabellenformat angezeigt wird. 03:22 Sie können sie auch in einem eigenen Fenster anzeigen. 03:25 Jetzt können Sie durch die Daten blättern, die Spalten sortieren, nach bestimmten Werten suchen oder die Zeilen mithilfe der Schieberegler und Dropdown-Menüs filtern. 03:41 Das Teilfenster "Umgebung" enthält eine Registerkarte "Umgebung", eine Registerkarte "Verlauf" und eine Registerkarte "Verbindungen" und protokolliert die Vorgänge in dieser R-Sitzung. 03:51 Die Registerkarte "Umgebung" enthält die R-Objekte, die in Ihrer globalen Umgebung vorhanden sind und während der Sitzung erstellt werden. 03:58 Wenn Sie also ein neues Objekt im Konsolenfenster erstellen, wird es automatisch im Umgebungsfenster angezeigt. 04:04 Sie können auch die Objekte anzeigen, die zu einem bestimmten Paket gehören, und sogar den Quellcode für eine bestimmte Funktion anzeigen. 04:12 Sie können auch eine Liste der Datasets anzeigen, ein Dataset erweitern, um seine einzelnen Elemente zu untersuchen, und sie im Quellenfenster anzeigen. 04:22 Sie können den Inhalt einer Umgebung als .RData-Datei speichern, sodass Sie diese .RData-Datei zu einem späteren Zeitpunkt laden können. 04:29 Von hier aus können Sie auch die Objekte aus dem Arbeitsbereich löschen. 04:33 Wenn Sie bestimmte Elemente löschen möchten, verwenden Sie die Rasteransicht. 04:38 Sie können beispielsweise ohne großen Aufwand große zu löschende Elemente finden, um Speicherplatz in Ihrer R-Sitzung freizugeben. 04:45 Auf der Registerkarte "Umgebung" können Sie auch ein Dataset importieren. 04:50 Sie können eine Vorschau des Datasets anzeigen und Optionen ändern, bevor Sie den Import abschließen. 04:55 Die importierten Daten werden im Quellenfenster angezeigt. 05:00 Auf der Registerkarte "Protokoll" wird ein Protokoll aller Befehle angezeigt, die Sie in der Befehlszeile ausführen. 05:05 Genau wie auf der Registerkarte "Umgebung" können Sie den Verlauf als .Rhistory-Datei speichern, sodass Sie ihn zu einem späteren Zeitpunkt öffnen können. 05:11 Diese Registerkarte enthält dieselben Optionen zum Löschen des gesamten Verlaufs und der einzelnen Einträge im Verlauf. 05:17 Wählen Sie einen Befehl aus und senden Sie ihn an die Konsole, um den Befehl erneut auszuführen. 05:23 Sie können auch einen Befehl in das Quellenfenster kopieren, um ihn in ein Script einzuschließen. 05:31 Auf der Registerkarte "Verbindungen" können Sie eine neue Verbindung zu einer Datenquelle herstellen. 05:36 Die Auswahlmöglichkeiten in diesem Dialogfenster hängen von den installierten Paketen ab. 05:41 Eine "BLUDB" -Verbindung ermöglicht Ihnen beispielsweise, eine Verbindung zu einem Db2 Warehouse on Cloud -Service herzustellen. 05:49 Das Dateifenster enthält die Registerkarten "Dateien", "Diagramme", "Pakete", "Hilfe" und "Viewer". 05:55 Im Register "Dateien" wird der Inhalt Ihres Arbeitsverzeichnisses angezeigt. 05:59 RStudio lädt Dateien aus diesem Verzeichnis und speichert Dateien in diesem Verzeichnis. 06:04 Navigieren Sie zu einer Datei und klicken Sie auf die Datei, um sie im Quellenfenster anzuzeigen. 06:09 Von hier aus können Sie neue Ordner erstellen und Dateien hochladen, indem Sie entweder einzelne Dateien zum Hochladen auswählen oder eine ZIP-Datei mit allen hochzuladenden Dateien auswählen. 06:25 Hier können Sie auch Dateien und Ordner löschen und umbenennen. 06:30 Für den Zugriff auf die Datei in R müssen Sie den Datenordner als Arbeitsverzeichnis definieren. 06:36 Sie werden sehen, dass der Befehl setwd in der Konsole ausgeführt wurde. 06:43 Sie können auf die Datenassets in Ihrem Projekt zugreifen, indem Sie den Projektordner öffnen. 06:50 Auf der Registerkarte "Diagramme" werden die Ergebnisse der R-Plot-Funktionen angezeigt, wie z. B. Plot, Hist, ggplot und Plot. 07:00 Sie können mit den Pfeilen durch verschiedene Diagramme navigieren oder zoomen, um eine Gesamtanzeige des Diagramms anzuzeigen. 07:09 Sie können auch einzelne Diagramme oder alle Diagramme von hier löschen. 07:13 Verwenden Sie die Option "Exportieren", um das Diagramm als Grafik oder Druckdatei mit der angegebenen Auflösung zu speichern. 07:21 Auf der Registerkarte "Pakete" werden die Pakete angezeigt, die Sie derzeit in Ihrer Systembibliothek installiert haben. 07:26 In der Suchleiste können Sie schnell ein bestimmtes Paket finden. 07:30 Die geprüften Pakete sind die Pakete, die bereits mit dem Bibliotheksbefehl in der aktuellen Sitzung geladen wurden. 07:38 Sie können zusätzliche Pakete von hier aus überprüfen, um sie zu laden, oder die Auswahl von Paketen aufheben, um sie von der aktuellen Sitzung abzuhängen. 07:45 Im Konsolenfenster werden die Ergebnisse angezeigt. 07:48 Verwenden Sie das "X" neben einem Paketnamen, um es aus der Systembibliothek zu entfernen. 07:54 Sie können auch nach neuen Paketen suchen, um sie zu installieren oder auf die neueste Version eines Pakets zu aktualisieren. 08:03 Wenn Sie auf eines der Pakete klicken, wird die Registerkarte "Hilfe" mit zusätzlichen Informationen zu diesem Paket geöffnet. 08:09 Von hier aus können Sie nach Funktionen suchen, um weitere Hilfe zu erhalten. 08:13 In der Konsole können Sie den Befehl help verwenden oder einfach ein Fragezeichen gefolgt von der Funktion eingeben, um Hilfe zu dieser Funktion abzurufen. 08:21 Auf der Registerkarte "Viewer" wird die HTML-Ausgabe angezeigt. 08:25 Einige R-Funktionen generieren HTML, um Berichte und interaktive Diagramme anzuzeigen. 08:31 Das R-Paket Markdown erstellt Berichte, die Sie auf der Registerkarte "Viewer" anzeigen können. 08:38 Das Shiny-Package erstellt Web-Apps, die Sie auf der Registerkarte "Viewer" anzeigen können. 08:44 Und andere Pakete bauen auf dem htmlwidgets-Framework auf und enthalten Java-basierte interaktive Visualisierungen. 08:54 Sie können die Visualisierung auch auf der freien Site namensRPubs.comveröffentlichen. 09:01 Dies ist ein kurzer Überblick über die RStudio IDE. 09:05 Weitere Videos zu RStudio finden Sie in der Dokumentation Cloud Pak for Data as a Service.
Übergeordnetes Thema: Notebooks und Scripts