Maschinell übersetztes Thema Sie können zur englischen Version wechseln.
Die genaueste und aktuellste Version dieser Dokumentation finden Sie in der englischen (ursprünglichen) Version. IBM haftet nicht für Schäden oder Verluste, die durch die Verwendung automatisch (maschinell) übersetzter Inhalte entstehen.
RStudio
Letzte Aktualisierung: 14. Jan. 2025
RStudio
R ist ein beliebtes Paket für statistische Analysen und maschinelles Lernen, das die Datenverwaltung ermöglicht und Tests, Modelle, Analysen und Grafiken umfasst. RStudio, das in IBM watsonx.ai Studio enthalten ist, bietet eine integrierte Entwicklungsumgebung für die Arbeit mit R-Skripten.
Nutzungshinweise und Einschränkungen
Copy link to section
RStudio ist in IBM watsonx.ai Studio-Projekte integriert. Sie können es starten, nachdem Sie ein Projekt erstellt haben.
Sie können auf Datendateien zugreifen und diese verwenden, die im IBM Cloud Object Storage Bucket gespeichert sind, der mit Ihrem Projekt verknüpft ist.
Sie können RStudio IDE verwenden, um Shiny-Anwendungen zu erstellen, aber Sie können sie nicht in Cloud Pak for Data as a Service bereitstellen.
Starten der RStudio
Copy link to section
So starten Sie die RStudio IDE in Ihrem Projekt:
Klicken Sie im Menü IDE starten in der Aktionsleiste Ihres Projekts auf RStudio.
Wählen Sie eine Umgebung aus.
Klicken Sie auf Starten.
Die Umgebungslaufzeit wird initialisiert und die Entwicklungsumgebung wird geöffnet.
Fehlerbehebung bei Problemen beim Starten der RStudio IDE
Copy link to section
Beim Starten von RStudio können die folgenden Probleme auftreten:
Korrumpierter RStudio aus einer vorherigen Sitzung
Copy link to section
Problem: ' Wenn Sie eine RStudio starten, kann es vorkommen, dass der RStudio aus einer früheren Sitzung beschädigt ist und Ihre Sitzung nicht startet. Lösung: ' Nach dem Start der RStudio wählen Sie in der Phase, in der Sie die RStudio auswählen, die Option Reset the workspace. RStudio wird mit den Standardeinstellungen und einem sauberen RStudio gestartet.
Mit Datendateien arbeiten
Copy link to section
In RStudio können Sie mit Datendateien aus verschiedenen Quellen arbeiten:
Dateien in der Dateistruktur des RStudio-Servers, die Sie durch Klicken auf Dateien im rechten unteren Bereich von RStudio anzeigen können. In diesem Bereich können Sie Ordner erstellen, Dateien aus Ihrem lokalen System hochladen und Dateien löschen.
Um auf die Dateien in R zugreifen zu können, müssen Sie das Arbeitsverzeichnis auf das Verzeichnis festlegen, das die Dateien enthält. Navigieren Sie dazu zu dem Verzeichnis mit den Dateien und klicken Sie auf Mehr > Als Arbeitsverzeichnis festlegen.
Beachten Sie, dass Dateien, die im Verzeichnis Home Ihrer RStudio-Instanz gespeichert sind, nur in Ihrer Instanz persistent sind und nicht gemeinsam in mehreren Umgebungen genutzt werden können.
Sehen Sie sich dieses Video an, um zu erfahren, wie Daten in RStudio geladen werden.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Projektdatenassets in dem IBM Cloud Object Storage-Bucket, das Ihrem Projekt zugeordnet ist. Beim Start von RStudio wird der Inhalt des IBM Cloud Object Storage-Buckets an das Verzeichnis project-objectstorage im Home von RStudio angehängt.
Wenn Datendateien im Verzeichnis project-objectstorage angezeigt werden sollen, müssen Sie sie als Assets zu Ihrem Projekt hinzufügen. Weitere Informationen finden Sie unter Dateien als Projektassets hinzufügen.
Wenn neue Datenassets zum Projekt hinzugefügt werden, während Sie sich in RStudio befinden, und Sie auf diese Assets zugreifen möchten, müssen Sie den Ordner project-objectstorage aktualisieren.
Daten, die in einem Datenbanksystem gespeichert sind.
In diesem Video erfahren Sie, wie Sie eine Verbindung zu externen Datenquellen in RStudio herstellen.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Im lokalen Speicher gespeicherte Dateien , die an /home/rstudioangehängt sind. Das Verzeichnis " home hat eine Speicherbegrenzung von 2 GB und wird zum Speichern des RStudio verwendet. Beachten Sie, dass Sie 2 GB für Ihr ' home für alle Ihre Projekte zugewiesen bekommen, unabhängig davon, ob Sie RStudio in jedem Projekt verwenden. Daher sollten Sie nur R-Scriptdateien und kleine Datendateien im Verzeichnis home speichern. Sie ist nicht für große Datendateien oder große generierte Ausgaben gedacht. Alle großen Datendateien sollten als Projektassets hochgeladen werden, die an das Verzeichnis project-objectstorage angehängt sind, von wo aus Sie darauf zugreifen können.
Dateien als Projektassets hinzufügen
Copy link to section
Wenn Sie möchten, dass Ihre Datendateien improject-objectstorage Verzeichnis, müssen Sie sie Ihrem Projekt als Datenbestände hinzufügen. Gehen Sie wie folgt vor, um diese Dateien als Datenassets zum Projekt hinzuzufügen:
Klicken Sie auf der Seite Assets des Projekts auf das Symbol Asset zum Projekt hochladen und wählen Sie die Registerkarte Dateien.
Wählen Sie die Dateien aus, die Sie dem Projekt als Assets hinzufügen möchten.
Wählen Sie in der Aktionsliste Als Datenasset hinzufügen aus und wenden Sie Ihre Änderungen an.
Kapazitätsverbrauch und Laufzeitbereich
Copy link to section
Eine RStudio ist immer auf eine Umgebungsvorlage und einen RStudio beschränkt. Pro watsonx.ai Studio-Benutzer kann jeweils nur eine RStudio aktiv sein. Wenn Sie RStudio in einem anderen Projekt gestartet haben, werden Sie gefragt, ob Sie diese Sitzung stoppen und eine neue RStudio-Sitzung im Kontext des aktuell von Ihnen bearbeiteten Projekt starten möchten.
Die Laufzeitnutzung wird über die von der aktiven Umgebungslaufzeit verbrauchten Capacity-Unit-Stunden (CUH) berechnet. Die von einer aktiven RStudio-Laufzeit in einem Projekt verbrauchten Capacity-Unit-Stunden werden dem Konto des Projekterstellers in Rechnung gestellt. Weitere Informationen finden Sie unter Abrechnung für RStudio nach CUH.
Auf der Seite Umgebungen des Projekts können Sie sehen, welche RStudio-Umgebungslaufzeiten aktiv sind. Sie können Ihre Laufzeit auf dieser Seite stoppen.
Berücksichtigen Sie Folgendes: Der CUH-Zähler läuft weiter, solange die Laufzeit aktiv ist. Stoppen Sie die Laufzeit, wenn Sie RStudio nicht verwenden. Wenn Sie die Laufzeit nicht ausdrücklich stoppen, wird sie nach einer Leerlaufzeit von 2 Stunden für Sie gestoppt. Während der Dauer der Inaktivität werden weiterhin Capacity-Unit-Stunden verbraucht, die Ihnen in Rechnung gestellt werden. Lange rechenintensive Jobs werden nach 24 Stunden sofort gestoppt.
Dieses Video bietet eine Übersicht über die RStudio-IDE.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Transkript
Videomitschrift
Zeit
Transkription
00:00
Dieses Video bietet einen kurzen Einblick in die integrierte Entwicklungsumgebung RStudio innerhalb eines Projekts.
00:07
Von jedem Projekt aus können Sie die RStudio starten.
00:12
RStudio ist eine freie und quelloffene integrierte Entwicklungsumgebung für R, eine Programmiersprache für statistische Berechnungen und Grafiken.
00:22
In RStudio gibt es vier Fenster: das Quellfenster, das Konsolenfenster, das Umgebungsfenster und das Datei-Fenster.
00:32
Die Teilfenster helfen Ihnen, Ihre Arbeit zu organisieren und die verschiedenen Aufgaben zu trennen, die Sie mit R ausführen werden.
00:39
Sie können die Größe der Teilfenster durch Ziehen ändern oder die Symbole verwenden, um ein Teilfenster zu minimieren und zu maximieren.
00:47
Sie können die Teilfenster auch in globalen Optionen neu anordnen.
00:53
Das Konsolenfenster ist Ihre Schnittstelle zu R.
00:56
Es ist genau das, was Sie in Terminal-Fenster oder Benutzerschnittstellen mit R gebündelt sehen würden.
01:01
Das Konsolenfenster enthält einige zusätzliche Funktionen, die Ihnen hilfreich sind.
01:06
Um Code über die Konsole auszuführen, geben Sie einfach den Befehl ein.
01:11
Beginnen Sie mit der Eingabe eines Befehls, um eine Liste der Befehle anzuzeigen, die mit den Buchstaben beginnen, die Sie eingegeben haben.
01:17
Markieren Sie einen Befehl in der Liste und drücken Sie die Eingabetaste, um ihn einzufügen.
01:24
Verwenden Sie den Aufwärtspfeil, um durch die zuvor eingegebenen Befehle zu blättern.
01:31
Wenn Sie weitere Befehle absetzen, können Sie durch die Ergebnisse blättern.
01:36
Verwenden Sie die Menüoption, um die Konsole zu löschen.
01:39
Sie können die Registerkartenvervollständigung auch verwenden, um eine Liste der Funktionen, Objekte und Datasets anzuzeigen, die mit diesem Text beginnen.
01:47
Verwenden Sie die Pfeile, um einen Befehl hervorzuheben und die Hilfe für diesen Befehl anzuzeigen.
01:51
Wenn Sie bereit sind, drücken Sie einfach "Enter", um es einzufügen.
01:55
Als Nächstes sehen Sie eine Liste der Optionen für diesen Befehl im aktuellen Kontext.
01:59
Das erste Argument für die Funktion read.csv ist beispielsweise die Datei.
02:05
RStudio zeigt eine Liste der Ordner und Dateien in Ihrem Arbeitsverzeichnis an, so dass Sie die Datei, die Sie mit dem Argument einschließen möchten, leicht finden können.
02:16
Wenn Sie die Registerkartenvervollständigung mit einer Funktion verwenden, die einen Paketnamen erwartet, z. B. eine Bibliothek, wird eine Liste aller installierten Pakete angezeigt.
02:28
Betrachten wir als Nächstes das Quellenteilfenster, das einfach ein Texteditor ist, in dem Sie Ihren R-Code schreiben können.
02:34
Der Texteditor unterstützt R-Befehlsdateien und einfachen Text sowie mehrere andere Sprachen und enthält sprachspezifische Hervorhebungen im Kontext.
02:47
Sie werden feststellen, dass die Vervollständigung der Registerkarte auch im Texteditor verfügbar ist.
02:53
Im Texteditor können Sie eine einzelne Codezeile ausführen oder mehrere auszuführende Codezeilen auswählen. Die Ergebnisse werden im Konsolenfenster angezeigt.
03:08
Sie können Ihren Code als R-Script speichern, um ihn gemeinsam zu nutzen oder später erneut auszuführen.
03:15
Die Ansichtsfunktion öffnet eine neue Registerkarte, auf der der Datenrahmen im Tabellenformat angezeigt wird.
03:22
Sie können sie auch in einem eigenen Fenster anzeigen.
03:25
Jetzt können Sie durch die Daten blättern, die Spalten sortieren, nach bestimmten Werten suchen oder die Zeilen mithilfe der Schieberegler und Dropdown-Menüs filtern.
03:41
Das Teilfenster "Umgebung" enthält eine Registerkarte "Umgebung", eine Registerkarte "Verlauf" und eine Registerkarte "Verbindungen" und protokolliert die Vorgänge in dieser R-Sitzung.
03:51
Die Registerkarte "Umgebung" enthält die R-Objekte, die in Ihrer globalen Umgebung vorhanden sind und während der Sitzung erstellt werden.
03:58
Wenn Sie also ein neues Objekt im Konsolenfenster erstellen, wird es automatisch im Umgebungsfenster angezeigt.
04:04
Sie können auch die Objekte anzeigen, die zu einem bestimmten Paket gehören, und sogar den Quellcode für eine bestimmte Funktion anzeigen.
04:12
Sie können auch eine Liste der Datasets anzeigen, ein Dataset erweitern, um seine einzelnen Elemente zu untersuchen, und sie im Quellenfenster anzeigen.
04:22
Sie können den Inhalt einer Umgebung als .RData-Datei speichern, sodass Sie diese .RData-Datei zu einem späteren Zeitpunkt laden können.
04:29
Von hier aus können Sie auch die Objekte aus dem Arbeitsbereich löschen.
04:33
Wenn Sie bestimmte Elemente löschen möchten, verwenden Sie die Rasteransicht.
04:38
Sie können beispielsweise ohne großen Aufwand große zu löschende Elemente finden, um Speicherplatz in Ihrer R-Sitzung freizugeben.
04:45
Auf der Registerkarte "Umgebung" können Sie auch ein Dataset importieren.
04:50
Sie können eine Vorschau des Datasets anzeigen und Optionen ändern, bevor Sie den Import abschließen.
04:55
Die importierten Daten werden im Quellenfenster angezeigt.
05:00
Auf der Registerkarte "Protokoll" wird ein Protokoll aller Befehle angezeigt, die Sie in der Befehlszeile ausführen.
05:05
Genau wie auf der Registerkarte "Umgebung" können Sie den Verlauf als .Rhistory-Datei speichern, sodass Sie ihn zu einem späteren Zeitpunkt öffnen können.
05:11
Diese Registerkarte enthält dieselben Optionen zum Löschen des gesamten Verlaufs und der einzelnen Einträge im Verlauf.
05:17
Wählen Sie einen Befehl aus und senden Sie ihn an die Konsole, um den Befehl erneut auszuführen.
05:23
Sie können auch einen Befehl in das Quellenfenster kopieren, um ihn in ein Script einzuschließen.
05:31
Auf der Registerkarte "Verbindungen" können Sie eine neue Verbindung zu einer Datenquelle herstellen.
05:36
Die Auswahlmöglichkeiten in diesem Dialogfenster hängen von den installierten Paketen ab.
05:41
Eine "BLUDB" -Verbindung ermöglicht Ihnen beispielsweise, eine Verbindung zu einem Db2 Warehouse on Cloud -Service herzustellen.
05:49
Das Dateifenster enthält die Registerkarten "Dateien", "Diagramme", "Pakete", "Hilfe" und "Viewer".
05:55
Im Register "Dateien" wird der Inhalt Ihres Arbeitsverzeichnisses angezeigt.
05:59
RStudio lädt Dateien aus diesem Verzeichnis und speichert Dateien in diesem Verzeichnis.
06:04
Navigieren Sie zu einer Datei und klicken Sie auf die Datei, um sie im Quellenfenster anzuzeigen.
06:09
Von hier aus können Sie neue Ordner erstellen und Dateien hochladen, indem Sie entweder einzelne Dateien zum Hochladen auswählen oder eine ZIP-Datei mit allen hochzuladenden Dateien auswählen.
06:25
Hier können Sie auch Dateien und Ordner löschen und umbenennen.
06:30
Für den Zugriff auf die Datei in R müssen Sie den Datenordner als Arbeitsverzeichnis definieren.
06:36
Sie werden sehen, dass der Befehl setwd in der Konsole ausgeführt wurde.
06:43
Sie können auf die Datenassets in Ihrem Projekt zugreifen, indem Sie den Projektordner öffnen.
06:50
Auf der Registerkarte "Diagramme" werden die Ergebnisse der R-Plot-Funktionen angezeigt, wie z. B. Plot, Hist, ggplot und Plot.
07:00
Sie können mit den Pfeilen durch verschiedene Diagramme navigieren oder zoomen, um eine Gesamtanzeige des Diagramms anzuzeigen.
07:09
Sie können auch einzelne Diagramme oder alle Diagramme von hier löschen.
07:13
Verwenden Sie die Option "Exportieren", um das Diagramm als Grafik oder Druckdatei mit der angegebenen Auflösung zu speichern.
07:21
Auf der Registerkarte "Pakete" werden die Pakete angezeigt, die Sie derzeit in Ihrer Systembibliothek installiert haben.
07:26
In der Suchleiste können Sie schnell ein bestimmtes Paket finden.
07:30
Die geprüften Pakete sind die Pakete, die bereits mit dem Bibliotheksbefehl in der aktuellen Sitzung geladen wurden.
07:38
Sie können zusätzliche Pakete von hier aus überprüfen, um sie zu laden, oder die Auswahl von Paketen aufheben, um sie von der aktuellen Sitzung abzuhängen.
07:45
Im Konsolenfenster werden die Ergebnisse angezeigt.
07:48
Verwenden Sie das "X" neben einem Paketnamen, um es aus der Systembibliothek zu entfernen.
07:54
Sie können auch nach neuen Paketen suchen, um sie zu installieren oder auf die neueste Version eines Pakets zu aktualisieren.
08:03
Wenn Sie auf eines der Pakete klicken, wird die Registerkarte "Hilfe" mit zusätzlichen Informationen zu diesem Paket geöffnet.
08:09
Von hier aus können Sie nach Funktionen suchen, um weitere Hilfe zu erhalten.
08:13
In der Konsole können Sie den Befehl help verwenden oder einfach ein Fragezeichen gefolgt von der Funktion eingeben, um Hilfe zu dieser Funktion abzurufen.
08:21
Auf der Registerkarte "Viewer" wird die HTML-Ausgabe angezeigt.
08:25
Einige R-Funktionen generieren HTML, um Berichte und interaktive Diagramme anzuzeigen.
08:31
Das R-Paket Markdown erstellt Berichte, die Sie auf der Registerkarte "Viewer" anzeigen können.
08:38
Das Shiny-Package erstellt Web-Apps, die Sie auf der Registerkarte "Viewer" anzeigen können.
08:44
Und andere Pakete bauen auf dem htmlwidgets-Framework auf und enthalten Java-basierte interaktive Visualisierungen.
08:54
Sie können die Visualisierung auch auf der freien Site namensRPubs.comveröffentlichen.
09:01
Dies ist ein kurzer Überblick über die RStudio IDE.
09:05
Weitere Videos zu RStudio finden Sie in der Dokumentation Cloud Pak for Data as a Service.
Use this interactive map to learn about the relationships between your tasks, the tools you need, the services that provide the tools, and where you use the tools.
Select any task, tool, service, or workspace
You'll learn what you need, how to get it, and where to use it.
Some tools perform the same tasks but have different features and levels of automation.
Jupyter notebook editor
Prepare data
Visualize data
Build models
Deploy assets
Create a notebook in which you run Python, R, or Scala code to prepare, visualize, and analyze data, or build a model.
AutoAI
Build models
Automatically analyze your tabular data and generate candidate model pipelines customized for your predictive modeling problem.
SPSS Modeler
Prepare data
Visualize data
Build models
Create a visual flow that uses modeling algorithms to prepare data and build and train a model, using a guided approach to machine learning that doesn’t require coding.
Decision Optimization
Build models
Visualize data
Deploy assets
Create and manage scenarios to find the best solution to your optimization problem by comparing different combinations of your model, data, and solutions.
Data Refinery
Prepare data
Visualize data
Create a flow of ordered operations to cleanse and shape data. Visualize data to identify problems and discover insights.
Orchestration Pipelines
Prepare data
Build models
Deploy assets
Automate the model lifecycle, including preparing data, training models, and creating deployments.
RStudio
Prepare data
Build models
Deploy assets
Work with R notebooks and scripts in an integrated development environment.
Federated learning
Build models
Create a federated learning experiment to train a common model on a set of remote data sources. Share training results without sharing data.
Deployments
Deploy assets
Monitor models
Deploy and run your data science and AI solutions in a test or production environment.
Catalogs
Catalog data
Governance
Find and share your data and other assets.
Metadata import
Prepare data
Catalog data
Governance
Import asset metadata from a connection into a project or a catalog.
Metadata enrichment
Prepare data
Catalog data
Governance
Enrich imported asset metadata with business context, data profiling, and quality assessment.
Data quality rules
Prepare data
Governance
Measure and monitor the quality of your data.
Masking flow
Prepare data
Create and run masking flows to prepare copies of data assets that are masked by advanced data protection rules.
Governance
Governance
Create your business vocabulary to enrich assets and rules to protect data.
Data lineage
Governance
Track data movement and usage for transparency and determining data accuracy.
AI factsheet
Governance
Monitor models
Track AI models from request to production.
DataStage flow
Prepare data
Create a flow with a set of connectors and stages to transform and integrate data. Provide enriched and tailored information for your enterprise.
Data virtualization
Prepare data
Create a virtual table to segment or combine data from one or more tables.
OpenScale
Monitor models
Measure outcomes from your AI models and help ensure the fairness, explainability, and compliance of all your models.
Data replication
Prepare data
Replicate data to target systems with low latency, transactional integrity and optimized data capture.
Master data
Prepare data
Consolidate data from the disparate sources that fuel your business and establish a single, trusted, 360-degree view of your customers.
Services you can use
Services add features and tools to the platform.
watsonx.ai Studio
Develop powerful AI solutions with an integrated collaborative studio and industry-standard APIs and SDKs. Formerly known as Watson Studio.
watsonx.ai Runtime
Quickly build, run and manage generative AI and machine learning applications with built-in performance and scalability. Formerly known as Watson Machine Learning.
IBM Knowledge Catalog
Discover, profile, catalog, and share trusted data in your organization.
DataStage
Create ETL and data pipeline services for real-time, micro-batch, and batch data orchestration.
Data Virtualization
View, access, manipulate, and analyze your data without moving it.
Watson OpenScale
Monitor your AI models for bias, fairness, and trust with added transparency on how your AI models make decisions.
Data Replication
Provide efficient change data capture and near real-time data delivery with transactional integrity.
Match360 with Watson
Improve trust in AI pipelines by identifying duplicate records and providing reliable data about your customers, suppliers, or partners.
Manta Data Lineage
Increase data pipeline transparency so you can determine data accuracy throughout your models and systems.
Where you'll work
Collaborative workspaces contain tools for specific tasks.
Project
Where you work with data.
> Projects > View all projects
Catalog
Where you find and share assets.
> Catalogs > View all catalogs
Space
Where you deploy and run assets that are ready for testing or production.
> Deployments
Categories
Where you manage governance artifacts.
> Governance > Categories
Data virtualization
Where you virtualize data.
> Data > Data virtualization
Master data
Where you consolidate data into a 360 degree view.
Über den Einsatz von Cookies auf dieser WebsiteUnsere Websites benötigen einige Cookies, um ordnungsgemäß zu funktionieren (erforderlich). Darüber hinaus können mit Ihrer Zustimmung weitere Cookies verwendet werden, um die Nutzung der Website zu analysieren, die Benutzerfreundlichkeit zu verbessern und Werbung zu schalten.Weitere Informationen finden Sie in Ihren Cookie-Benutzervorgaben. Durch den Besuch unserer Website erklären Sie sich mit der Verarbeitung von Informationen einverstanden, wie in der IBMDatenschutzbestimmung beschrieben.Um eine reibungslose Navigation zu ermöglichen, werden Ihre Cookie-Präferenzen über die hier aufgeführten IBM Web-Domains hinweg gemeinsam genutzt.