Nachdem Sie ein Projekt erstellt haben, besteht der nächste Schritt darin, Datenassets hinzuzufügen, damit Sie mit Daten arbeiten können. Alle Mitarbeiter im Projekt sind automatisch berechtigt, auf die Daten im Projekt zuzugreifen.
Unterschiedliche Assettypen können doppelte Namen haben. Sie können einen Assettyp mit demselben Namen jedoch nicht mehrmals hinzufügen.
Sie können die folgenden Methoden verwenden, um Datenassets zu Projekten hinzuzufügen:
Methode | Verwendung von |
---|---|
Lokale Dateien hinzufügen | Sie haben Daten in CSV-Dateien oder ähnlichen Dateien auf Ihrem lokalen System. |
Ressourcenhubdateien hinzufügen | Sie möchten Beispieldatasets verwenden. |
Datenbankverbindungen hinzufügen | Sie müssen eine Verbindung zu einer fernen Datenquelle herstellen. |
Daten aus einer Verbindung hinzufügen | Sie benötigen mindestens eine Tabelle oder Datei aus einer fernen Datenquelle. |
Dynamische Ansicht hinzufügen | Sie benötigen eine Ansicht, die eine Teilmenge der Daten in mindestens einer Tabelle in einer fernen Datenquelle enthält. |
Metadaten aus einer Verbindung importieren | Sie benötigen viele Tabellen oder Dateien aus einer fernen Datenquelle. Sie möchten den Importprozess planen und erneut ausführen. |
Verbundene Ordnerassets aus IBM Cloud Object Storage hinzufügen | Sie benötigen einen Ordner in IBM Cloud Object Storage , der eine dynamische Gruppe von Dateien enthält, z. B. einen Newsfeed. |
Katalogassets hinzufügen | Sie benötigen mindestens ein Asset aus einem Katalog. |
Dateien im Projektspeicher in Assets konvertieren | Sie möchten Dateien, die Sie im Projekt erstellt haben, in Datenassets konvertieren. |
Lokale Dateien hinzufügen
Sie können eine Datei aus Ihrem lokalen System als Datenasset in einem Projekt hinzufügen.
- Erforderliche Berechtigungen
Sie müssen über die Rolle Bearbeiter oder Administrator im Projekt verfügen.
- Einschränkungen
- Die Datei darf nicht leer sein.
- Der Dateiname darf nicht länger als 255 Zeichen sein.
- The maximum size for files that you can load with the UI is 5 GB. Sie können größere Dateien mit APIs in ein Projekt laden.
Gehen Sie wie folgt vor, um Datendateien zu einem Projekt hinzuzufügen:
Klicken Sie auf der Seite Assets Ihres Projekts auf das Symbol Asset in Projekt hochladen . Sie können auch in einem Notebook oder Erstellungsbereich auf dasselbe Symbol klicken.
Suchen Sie in dem sich öffnenden Teilfenster nach den Dateien oder ziehen Sie sie in das Teilfenster. Sie müssen auf der Seite bleiben, bis das Laden abgeschlossen ist.
Die Dateien werden in der Object Storage-Instanz gespeichert, der Ihrem Projekt zugeordnet ist, und als Datenassets auf der Seite Assets Ihres Projekts aufgelistet.
Wenn Sie auf den Datenassetnamen klicken, können Sie diese Informationen zu Datenassets aus Dateien anzeigen:
- Der Assetname und die Beschreibung
- Die Tags für das Asset
- Der Name der Person, die das Asset erstellt hat
- Die Größe der Daten
- Das Datum, an dem das Asset zum Projekt hinzugefügt wurde
- Das Datum, an dem das Asset zuletzt geändert wurde
- Ein Vorschau der Daten für CSV-, Avro-, Parquet-, TSV-, Microsoft Excel-, PDF-, Text-, JSON-und Bilddateien
- Ein Profil der Daten für CSV-, Avro-, Parquet-, TSV-und Microsoft Excel-Dateien
Sie können die Inhalte eines Datenassets aus einer Datei aktualisieren, indem Sie eine Datei mit demselben Namen und Format zum Projekt hinzufügen und dann wählen, dass das vorhandene Datenasset ausgetauscht werden soll.
Sie können das Datenasset entfernen, indem Sie die Option Löschen im Aktionsmenü neben dem Assetnamen auswählen. Wählen Sie die Option Daten vorbereiten aus, um die Daten mit Data Refineryeinzugrenzen.
Ressourcenhub-Datasets hinzufügen
Sie können Ihrem Projekt Datasets aus dem Ressourcenhub hinzufügen:
- Suchen Sie im Ressourcenhub die Karte für das Dataset, das Sie hinzufügen wollen.
- Klicken Sie auf das Symbol Zu Projekt hinzufügen in der Aktionsleiste, wählen Sie das Projekt aus und klicken Sie auf Hinzufügen.
In diesem kurzen Video erfahren Sie, wie Sie öffentliche Datasets laden und analysieren.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Videomitschrift Zeit Transkription 00:00 Dieses Video zeigt, wie Sie auf öffentliche Datasets in der Galerie Cloud Pak for Data as a Service zugreifen. 00:06 Starten Sie im Ressourcenhub und verwenden Sie die Filter, um nur die Dateien anzuzeigen. 00:13 Hier finden Sie einige umfangreiche Datasets, die Sie in Ihrer Analyse verwenden können. 00:17 Sie können beispielsweise nach "economy" oder "population" oder "weather" oder "jobs" suchen. 00:28 Dies scheint ein interessantes Dataset zu sein. 00:30 Öffnen Sie es und zeigen Sie eine Vorschau der Daten an. 00:34 Hier können Sie das Dataset in Social Media teilen, einen direkten Link zu dem Dataset abrufen oder das Dataset herunterladen. 00:45 Sie können die Datei auch in ein bestimmtes Projekt kopieren. 00:52 Navigieren Sie jetzt zu diesem Projekt. 00:55 Auf der Registerkarte "Assets" sehen Sie, dass das Dataset zum Abschnitt "Datenassets" hinzugefügt wurde. 01:01 Fügen Sie als Nächstes ein neues Notebook hinzu. 01:05 Der Titel für dieses Notebook lautet "Unemployment rates" (Arbeitslosenquote). 01:09 Wählen Sie eine Laufzeitumgebung und eine Sprache aus. 01:14 Wenn Sie bereit sind, erstellen Sie das Notebook. 01:20 Wenn das Notebook geladen wird, greifen Sie auf die Datenquellen zu und suchen Sie die Datei zur Arbeitslosenquote. 01:27 Klicken Sie auf "In Code einfügen" und wählen Sie aus, wie Sie die Daten einfügen möchten. 01:33 Die Auswahlmöglichkeiten in dieser Dropdown-Liste hängen von der Sprache ab, die in diesem Notebook verwendet wird. 01:38 Beachten Sie, dass der eingefügte Code die Berechtigungsnachweise enthält, die Sie zum Lesen der Datendatei aus der Object Storage-Instanz benötigen. 01:45 Wenn Sie den Code ausführen, werden die ersten fünf Zeilen angezeigt. 01:50 Jetzt können Sie mit der Analyse aller umfangreichen Datasets im Ressourcenhub beginnen. 01:56 Weitere Videos finden Sie in der Dokumentation zu Cloud Pak for Data as a Service.
Dateien im Projektspeicher in Assets konvertieren
Der Speicher für das Projekt enthält die Datenassets, die Sie in das Projekt hochgeladen haben, kann aber auch andere Dateien enthalten. Sie können beispielsweise einen DataFrame in einem Notebook im Projektumgebungsspeicher speichern. Sie können Dateien im Projektspeicher in Assets konvertieren.
Gehen Sie wie folgt vor, um Dateien im Projektspeicher in Assets zu konvertieren:
- Klicken Sie auf der Registerkarte Assets Ihres Projekts auf Asset importieren.
- Wählen Sie Projektdateienaus.
- Wählen Sie den Ordner data_asset aus.
- Wählen Sie das Asset aus und klicken Sie auf Import.
Nächste Schritte
Weitere Informationen
Übergeordnetes Thema: Daten vorbereiten