Erfahrung mit der Planung von Notebooks und Scripts
Um einen Plan für die Verwendung von Jupyter-Notebooks und -Scripts zu erstellen, müssen Sie zunächst die Auswahlmöglichkeiten, die Sie haben, die Auswirkungen dieser Auswahlmöglichkeiten und die Auswirkungen dieser Auswahlmöglichkeiten auf die Reihenfolge der Implementierungsaufgaben verstehen.
Die meisten Aufgaben, die mit Notizbüchern und Skripten zusammenhängen, können Sie mit der Rolle Editor oder Admin in einem Analyseprojekt durchführen.
Bevor Sie mit der Arbeit mit Notebooks und Scripts beginnen, sollten Sie die folgenden Fragen berücksichtigen, da die meisten Tasks in einer bestimmten Reihenfolge ausgeführt werden müssen:
- In welcher Programmiersprache möchten Sie arbeiten?
- Was werden Ihre Notebooks tun?
- Mit welchen Bibliotheken möchten Sie arbeiten?
- Wie können Sie das Notebook oder Script in IBM watsonxverwenden?
Um einen Plan für die Verwendung von Jupyter-Notebooks oder -Scripts zu erstellen, bestimmen Sie, welche der folgenden Tasks Sie ausführen müssen.
Aufgabe | Obligatorisch? | Ablaufsteuerung |
---|---|---|
Projekt erstellen | Ja | Dies muss Ihre erste Aufgabe sein |
Datenassets zum Projekt hinzufügen | Ja | Vorbereitungen für die Erstellung von Notebooks |
Programmiersprache auswählen | Ja | Vor der Auswahl des Tools |
Tool auswählen | Ja | Nach Auswahl der Sprache |
Bibliothekspakete überprüfen | Ja | Vor der Auswahl einer Laufzeitumgebung |
Geeignete Laufzeitumgebung auswählen | Ja | Vor dem Öffnen der Entwicklungsumgebung |
Lebenszyklus von Notebooks und Scripts verwalten | Nein | Wenn das Notebook oder Script bereit ist |
Verwendung für Notebooks und Scripts nach der Erstellung | Nein | Wenn das Notebook bereit ist |
Erstellen eines Projekts
Sie müssen ein Projekt erstellen, bevor Sie mit der Arbeit in Notebooks beginnen können.
Projekte : Sie können ein leeres Projekt aus einer Datei oder einer URL erstellen. In diesem Projekt:
- Sie können Jupyter Notebook und RStudio verwenden.
- Notebooks sind Assets im Projekt.
- Die Notebook-Zusammenarbeit basiert auf Sperren durch Benutzer auf Projektebene.
- R-Skripte und Shiny-Apps sind nicht Bestandteil des Projekts.
- Es findet keine Zusammenarbeit bei R-Skripten oder Shiny-Anwendungen statt.
Auswählen einer Programmiersprache
Sie können in den folgenden Sprachen arbeiten:
- Notebooks
- Python und R
- Scripts
- R-Skripte und R-Shiny-Anwendungen
Tool auswählen
In IBM watsonxkönnen Sie mit Notebooks und Scripts im folgenden Tool arbeiten:
- Editor für Jupyter-Notebooks
- Im Editor Jupyter Notebook können Sie Python oder R-Notebooks erstellen. Notebooks sind Assets in einem Projekt. Die Zusammenarbeit erfolgt nur auf Projektebene. Das Notebook wird beim Öffnen von einem Benutzer gesperrt und kann nur von demselben Benutzer oder einem Projektadministrator entsperrt werden.
- RStudio
- In RStudio können Sie R-Skripte und Shiny-Anwendungen erstellen. R-Scripts sind keine Assets in einem Projekt, d. h., es gibt keine Zusammenarbeit auf Projektebene.
Bibliothekspakete überprüfen
Wenn Sie ein Notebook in einer Laufzeitumgebung öffnen, haben Sie Zugriff auf eine große Auswahl vorinstallierter Data-Science-Bibliothekspakete. Viele Umgebungen enthalten auch Bibliotheken, die von IBM ohne Aufpreis bereitgestellt werden, wie z. B.:
- Watson Natural Language Processing-Bibliothek in Python -Umgebungen
- Bibliotheken für den Zugriff auf Projektassets
- Bibliotheken für Zeitreihen oder georäumliche Analysen in Spark-Umgebungen
Um eine Liste der Bibliothekspakete und der in einer Umgebungsvorlage enthaltenen Versionen aufzurufen, wählen Sie die Vorlage auf der Seite Vorlagen auf der Registerkarte Verwalten auf der Seite Umgebungen des Projekts aus.
Wenn Bibliotheken in einer Vorlage fehlen, können Sie sie hinzufügen:
- Über das Notebook oder Script
- Sie können bekannte Paketinstallationsbefehle für Ihre Umgebung verwenden. In Python -Notebooks können Sie beispielsweise
mamba
,conda
oderpip
verwenden. - Durch Erstellen einer angepassten Umgebungsvorlage
- Wenn Sie eine angepasste Vorlage erstellen, können Sie eine Softwareanpassung erstellen und die Bibliotheken hinzufügen, die Sie einschließen möchten. Details finden Sie unter Umgebungsvorlagen anpassen.
Laufzeitumgebung auswählen
Die Auswahl der Berechnungsumgebung für Ihr Notebook hängt von der zu verarbeitenden Datenmenge und der Komplexität der Datenanalyseprozesse ab.
watsonx.ai Studio bietet viele Standard-Umgebungsvorlagen mit verschiedenen Hardware-Größen und Software-Konfigurationen, um Ihnen den Einstieg zu erleichtern, ohne dass Sie eigene Vorlagen erstellen müssen. Diese enthaltenen Vorlagen werden auf der Seite Vorlagen auf der Registerkarte Verwalten auf der Seite Umgebungen des Projekts aufgelistet. Weitere Informationen zu den enthaltenen Umgebungen finden Sie unter Umgebungen.
Wenn die verfügbaren Vorlagen Ihren Anforderungen nicht entsprechen, können Sie benutzerdefinierte Vorlagen erstellen und die Hardware-und Softwarekonfiguration bestimmen. Details finden Sie unter Umgebungsvorlagen anpassen.
Mit Daten arbeiten
Gehen Sie wie folgt vor, um mit Daten in einem Notebook zu arbeiten:
- Fügen Sie die Daten zu Ihrem Projekt hinzu, wodurch die Daten in ein Projektasset umgewandelt werden. Die verschiedenen Methoden zum Hinzufügen von Daten zu einem Projekt finden Sie unter Daten zu einem Projekt hinzufügen .
- Verwenden Sie generierten Code, der Daten aus dem Asset in eine Datenstruktur in Ihrem Notebook lädt. Eine Liste der unterstützten Datentypen finden Sie unter Unterstützung für Datenladevorgänge.
- Schreiben Sie eigenen Code, um Daten zu laden, wenn die Datenquelle nicht als Projektasset hinzugefügt wird oder wenn die Unterstützung für das Hinzufügen von generiertem Code für das Projektasset nicht verfügbar ist.
Lebenszyklus von Notebooks und Scripts verwalten
Nach dem Erstellen und Testen eines Notebooks in Ihrem Tool haben Sie folgende Möglichkeiten:
- Veröffentlichen Sie sie in einem Katalog, damit andere Katalogmitglieder das Notebook in ihren Projekten verwenden können. Weitere Informationen finden Sie im Abschnitt Assets aus einem Projekt in einem Katalog veröffentlichen.
- Geben Sie eine schreibgeschützte Kopie außerhalb von watsonx.ai Studio frei, damit auch Personen, die nicht an Ihren Projekten beteiligt sind, diese sehen und nutzen können. Siehe Notebooks mit einer URL gemeinsam nutzen.
- Veröffentlichen Sie sie in einem GitHub -Repository. Siehe Notebooks auf GitHub.
- Als Gist veröffentlichen. Siehe Notebook als Gist veröffentlichen.
R-Skripte und Shiny-Apps können nicht über die Funktionalität in einem Projekt veröffentlicht oder freigegeben werden.
Verwendung für Notebooks und Scripts nach der Erstellung
Zu den Optionen für ein Notebook, das in IBM watsonx erstellt wurde und verwendet werden kann, gehören:
Ausführung als Job in einem Projekt. Siehe Jobs in einem Projekt erstellen und verwalten.
Ausführen als Teil von Pipelines. Siehe Pipelineknoten konfigurieren.
Gehen Sie wie folgt vor, um sicherzustellen, dass ein Notebook als Job oder in einer Pipeline ausgeführt werden kann:
- Stellen Sie sicher, dass keine Zellen eine interaktive Eingabe durch einen Benutzer erfordern.
- Stellen Sie sicher, dass das Notebook genügend detaillierte Informationen protokolliert, um den Fortschritt und alle Fehler zu verstehen, indem Sie das Protokoll überprüfen.
- Verwenden Sie Umgebungsvariablen im Code, um auf Konfigurationen zuzugreifen, wenn sie für ein Notebook oder ein Script erforderlich sind, z. B. die Eingabedatendatei oder die Anzahl der Trainingsläufe.
Mit dem Python der watsonx.ai Runtime können Sie Ihre Modelle erstellen, trainieren und anschließend einsetzen. Siehe watsonx.ai Runtime Python Client Beispiele und Beispiele.
Verwendung der watsonx.ai Runtime REST API zum Erstellen, Trainieren und Bereitstellen Ihrer Modelle.
R-Skripte und Shiny-Apps können nur in der RStudio IDE in IBM watsonx erstellt und verwendet werden. Sie können keine Aufträge für R-Skripte oder R Shiny-Bereitstellungen erstellen.
Übergeordnetes Thema: Notebooks und Scripts