Sie können Python -und R-Code mithilfe von Jupyter-Notebooks und -Scripts in Codeeditoren erstellen, bearbeiten und ausführen, z. B. im Notebook-Editor oder in einer integrierten Entwicklungsumgebung (IDE) wie RStudio.
- Notebooks
- Ein Jupyter-Notebook ist eine webbasierte Umgebung für den Dialogbetrieb. Sie können Notebooks verwenden, um kleine Codeteile auszuführen, die Ihre Daten verarbeiten, und Sie können die Ergebnisse Ihrer Berechnung sofort anzeigen. Notebooks enthalten alle Bausteine, die Sie für die Arbeit mit Daten benötigen, nämlich die Daten, die Codeberechnungen, die die Daten verarbeiten, die Visualisierungen der Ergebnisse sowie Text und Rich Media, um das Verständnis zu verbessern.
- Scripts
- Ein Script ist eine Datei, die eine Gruppe von Befehlen und Kommentaren enthält. Das Script kann gespeichert und später verwendet werden, um die gespeicherten Befehle erneut auszuführen. Anders als in einem Notebook können die Befehle in einem Script nur linear ausgeführt werden.
Notizbücher
- Erforderliche Berechtigungen
- Rolle Editor oder Administrator in einem Projekt
- Dienstprogramme
- Notebookeditor
- Programmiersprachen
- Python und R
- Datenformat
- Alle Typen
- Die Codeunterstützung ist verfügbar, um Daten aus Projektassets zu laden und darauf zuzugreifen für:
- Datenassets, z. B. CSV-, JSON-, XLSX-und XLS-Dateien
- Datenbankverbindungen und verbundene Datenassets
Siehe Unterstützung von Datenladevorgängen. für die unterstützten Datei-und Datenbanktypen.
- Data Size
- 5 GB. Wenn die Dateien größer sind, müssen Sie die Daten in mehreren Teilen laden.
Scripts
- Erforderliche Berechtigungen
- Rolle Editor oder Administrator in einem Projekt
- Dienstprogramme
- RStudio
- Programmiersprachen
- R
- Datenformat
- Alle Typen
- Die Codeunterstützung ist verfügbar, um Daten aus Projektassets zu laden und darauf zuzugreifen für:
- Datenassets, z. B. CSV-, JSON-, XLSX-und XLS-Dateien
- Datenbankverbindungen und verbundene Datenassets
Siehe Unterstützung von Datenladevorgängen. für die unterstützten Datei-und Datenbanktypen.
- Data Size
- 5 GB. Wenn die Dateien größer sind, müssen Sie die Daten in mehreren Teilen laden.
Im Notebook-Editor arbeiten
Der Notebook-Editor wird hauptsächlich für die interaktive, explorative Datenanalyseprogrammierung und Datenvisualisierung verwendet. Nur jeweils eine Person kann ein Notebook bearbeiten. Alle anderen Benutzer können nur im Anzeigemodus auf geöffnete Notebooks zugreifen, während sie gesperrt sind.
Sie können die folgenden Bibliothekstypen verwenden:
- Vorinstallierte Open-Source-Bibliotheken, die mit den Notebook-Laufzeitumgebungen geliefert werden
- IBM -Bibliotheken, die ohne zusätzliche Kosten bereitgestellt werden und mit den Notebook-Laufzeitumgebungen geliefert werden
- Eigene Bibliotheken
Wenn Ihre Notebooks bereit sind, können Sie Jobs erstellen, um die Notebooks direkt über den Notebook-Editor auszuführen. Ihre Jobkonfigurationen können Umgebungsvariablen verwenden, die an die Notebooks mit unterschiedlichen Werten übergeben werden, wenn die Notebooks ausgeführt werden.
Arbeiten in RStudio
RStudio ist eine integrierte Entwicklungsumgebung für die Arbeit mit R-Scripts oder Shiny-Apps. Obwohl die RStudio-IDE nicht in einer Spark mit R-Umgebungslaufzeit gestartet werden kann, können Sie Spark in Ihren R-Scripts und Shiny-Anwendungen verwenden, indem Sie programmgesteuert auf Spark-Kernel zugreifen.
R-Scripts und Shiny-Apps können nur in der RStudio-IDE erstellt und verwendet werden. Sie können keine Jobs für R-Scripts oder R Shiny-Bereitstellungen erstellen.
Weitere Informationen
Übergeordnetes Thema: Daten analysieren und Modelle erstellen