Schnelleinstieg: Daten in einem Jupyter-Notizbuch analysieren

Sie können ein Notebook erstellen, in dem Sie Code ausführen, um Daten vorzubereiten, zu visualisieren und zu analysieren oder ein Modell zu erstellen und zu trainieren. Lesen Sie die Informationen zu Jupyter Notebooks, sehen Sie sich dann ein Video an und führen Sie ein Lernprogramm aus, das für Benutzer geeignet ist, die bereits über einige Kenntnisse zum Python-Code verfügen.

Ihr grundlegender Workflow umfasst die folgenden Tasks:

  1. Sie erstellen ein Projekt. Projekte sind der Ort, an dem Sie gemeinsam mit anderen mit Daten arbeiten.
  2. Fügen Sie dem Projekt Daten hinzu. Sie können CSV-Dateien oder Daten aus einer fernen Datenquelle über eine Verbindung hinzufügen.
  3. Erstellen Sie ein Notebook in dem Projekt.
  4. Fügen Sie Code zum Notebook hinzu, um Ihre Daten zu laden und zu analysieren.
  5. Führen Sie Ihr Notebook aus und teilen Sie die Ergebnisse mit Ihren Kollegen.

Lesen Sie mehr über Notebooks

Ein Jupyter-Notebook ist eine webbasierte Umgebung für Datenverarbeitung im Dialogbetrieb. Sie können kleine Codeteile ausführen, von denen Daten verarbeitet werden, und die Ergebnisse der Berechnung sofort anzeigen. Notebooks beinhalten alle Bausteine, die Sie zur Arbeit mit Daten benötigen:

  • Die Daten
  • Die Codeberechnungen, die die Daten verarbeiten
  • Die Visualisierungen der Ergebnisse
  • Text und Rich Media zur Förderung des Erkenntnisgewinns

Weitere Informationen zu Notebooks

Video über Notebooks ansehen

Video ansehen In diesem Video werden die Grundlagen von Jupyter Notebooks vorgestellt.

Dieses Video bietet eine visuelle Darstellung als Alternative zu den im Folgenden schriftlich dokumentierten Schritten.

Lernprogramm zum Erstellen eines Notebooks absolvieren

In diesem Lernprogramm führen Sie folgende Tasks aus:

  • Erstellen Sie ein Projekt und fügen Sie ein Asset aus der Gallery hinzu.
  • Notebook erstellen.
  • Analysieren Sie Daten im Notebook.
  • Bearbeiten und teilen Sie das Notebook für die gemeinsame Verwendung.
  • Erstellen Sie einen Job, um das Notebook auszuführen.

Für dieses Lernprogramm benötigen Sie ungefähr 15 Minuten.

{: #step1}Sie benötigen ein Projekt zum Speichern des Notebooks und des Datenassets.

  1. Wenn Sie über ein bestehendes Projekt verfügen, öffnen Sie es. Wenn kein Projekt vorhanden ist, klicken Sie auf der Homepage auf Projekt erstellen oder auf der Seite Projekte auf Neues Projekt.
  2. Wählen Sie Leeres Projekt erstellen aus.
  3. Fügen Sie in der Anzeige Projekt erstellen einen Namen und optional eine Beschreibung für das Projekt hinzu.
  4. Wählen Sie eine vorhandene Instanz des Objektspeicherservice aus oder erstellen Sie eine neue Instanz.
  5. Klicken Sie auf Erstellen.
  6. Klicken Sie im Navigationsmenü auf Gallery.
  7. Suchen Sie nach einem interessanten Dataset und wählen Sie es aus.
  8. Klicken Sie auf Zu Projekt hinzufügen.
  9. Wählen Sie das Projekt in der Liste aus und klicken Sie dann auf Hinzufügen.
  10. Klicken Sie nach dem Hinzufügen des Datasets auf Projekt anzeigen. Das Dataset wird auf der Registerkarte Assets angezeigt.

Weitere Informationen sowie ein Video finden Sie unter Projekt erstellen.
Weitere Informationen zum Hinzufügen von Gallery-Assets zu einem Projekt für den Zugriff in einem Notebook finden Sie unter Daten in einem Notebook laden und darauf zugreifen.

Schritt 2: Ein Notebook zu Ihrem Projekt hinzufügen

{: #step2} Erstellen Sie ein neues Notebook in Ihrem Projekt.

  1. Klicken Sie auf der Seite Assets Ihres Projekts auf Neues Asset > Notebook.
  2. Geben Sie einen Namen und eine Beschreibung ein (optional).
  3. Wählen Sie eine Laufzeitumgebung für dieses Notebook aus.
  4. Klicken Sie auf Erstellen. Warten Sie, bis der Notebookeditor geladen wurde.

Schritt 3: Eine Datei laden und das Notebook speichern

{: #step3}Laden Sie Daten in ein pandas DataFrame.

  1. Klicken Sie auf das Symbol Daten suchen und hinzufügen.
  2. Klicken Sie auf der Registerkarte Dateien auf das Dropdown-Menü In Code einfügen neben dem von Ihnen hinzugefügten Dataset und fügen Sie das pandas DataFrame ein.
  3. Klicken Sie auf Ausführen, um Ihren Code auszuführen. Die ersten Zeilen Ihres Datasets werden angezeigt.
  4. Um eine Version Ihres Notebooks zu speichern, klicken Sie auf Datei > Version speichern. Sie können Ihr Notebook auch einfach über Datei > Speichern speichern.

Schritt 4: Das Notebook suchen und bearbeiten

{: #step4}Suchen Sie das gespeicherte Notizbuch auf der Registerkarte 'Assets' und bearbeiten Sie es.

  1. Kehren Sie zu Ihrem Projekt zurück, um Ihr Notebook auf der Registerkarte Assets zu suchen.
  2. Wenn Sie auf das Notebook klicken, wird es im Modus READ ONLY geöffnet.
  3. Klicken Sie zum Bearbeiten des Notebooks auf das Stiftsymbol.
  4. Rufen Sie die Anzeige Informationen auf.
  5. Bearbeiten Sie auf der Registerkarte Allgemein den Namen und die Beschreibung des Notebooks.
  6. Klicken Sie auf die Registerkarte Umgebung, um anzuzeigen, wo Sie die Umgebung ändern können, die zum Ausführen des Notebooks verwendet wird, oder aktualisieren Sie den Laufzeitstatus in 'Stoppen und erneut starten'.

Schritt 5: Eine schreibgeschützte Version des Notebooks zur gemeinsamen Verwendung teilen

{: #step5} Erstellen Sie einen Link zum Notebook, um es mit Kollegen zu teilen.

  1. Klicken Sie auf das Symbol Teilen, wenn Sie die schreibgeschützte Ansicht des Notebooks gemeinsam nutzen möchten.
  2. Klicken Sie hier, um die Umschaltfläche Für jeden freigeben, der über den Link verfügt zu aktivieren.
  3. Wählen Sie aus, welche Inhalte Sie über einen Link oder Social Media mit anderen gemeinsam nutzen möchten.
  4. Klicken Sie auf Schließen.

Schritt 6: Die Ausführung eines Notebooks für einen anderen Zeitpunkt planen

{: #step6} Erstellen Sie einen Job, um das Notebook so zu terminieren, dass es zu einem bestimmten Zeitpunkt ausgeführt oder auf Basis eines Zeitplans wiederholt ausgeführt wird.

  1. Klicken Sie auf das Symbol Job und wählen Sie Job erstellen aus.
  2. Geben Sie den Namen und die Beschreibung des Jobs an und klicken Sie auf Weiter.
  3. Wählen Sie die Notebookversion und Umgebungslaufzeit aus und klicken Sie auf Weiter.
  4. (Optional) Klicken Sie auf die Umschaltfläche, um eine Ausführung zu planen. Geben Sie das Datum und die Uhrzeit an, legen Sie fest, ob der Job wiederholt werden soll, und klicken Sie auf Weiter.
  5. (Optional) Klicken Sie auf die Umschaltfläche, um Benachrichtigungen für diesen Job zu empfangen, und klicken Sie auf Weiter.
  6. Überprüfen Sie die Details und klicken Sie auf Erstellen (um den Job zu erstellen, aber nicht sofort auszuführen) oder auf Erstellen und ausführen (um den Job sofort auszuführen).
  7. Der Job wird auf der Registerkarte Jobs im Projekt angezeigt.

Nächste Schritte

Sie können dieses Dataset nun für weitere Analysen verwenden. Beispielsweise können Sie oder andere Benutzer eine der folgenden Tasks ausführen:

Zusätzliche Ressourcen

  • Sehen Sie sich weitere Videos über Notebooks an.
  • Suchen Sie in der Gallery nach Datasets und Notebooks, um praxisorientierte Erfahrungen zum Verfeinern von Daten zu sammeln.
  • Beschleunigen Sie die Arbeit mit Ihren Daten mithilfe der von IBM bereitgestellten branchenspezifischen Akzeleratoren, bei denen es sich um eine Gruppe von End-to-End-Lösungen handelt, die Sie als Beispiele ausführen oder anpassen können, um allgemeine Geschäftsprobleme zu beheben. Die meisten Akzeleratoren schließen ein Beispielprojekt ein, das alles enthält, was Sie zum Analysieren von Daten, zum Erstellen eines Modells und zum Anzeigen von Ergebnissen benötigen.

Übergeordnetes Thema: Erste Schritte zur Analyse und Visualisierung von Daten