Assettypen und -eigenschaften

Ein Element Asset enthält Metadaten für Daten sowie weitere Informationstypen oder ausführbaren Code. Sie arbeiten mit Assets in der gesamten Cloud Pak for Data-Plattform, einschließlich der Hauptarbeitsbereiche: Projekte, Kataloge und Bereitstellungsbereiche.

Sie können die folgenden grundlegenden Assettypen erstellen:

  • Datenassets enthalten Metadaten für Daten, einschließlich der Zugriffsmöglichkeiten auf die Daten.
  • Betriebsassets führen Code zum Arbeiten mit Daten oder anderen Informationstypen aus
  • Konfigurationsassets enthalten wiederverwendbare Vorlagen.

Um ein Verständnis für Assets zu entwickeln, müssen Sie die verschiedenen Typen von Assets, ihre Eigenschaften und ihren Standort kennen:

Arbeitsbereiche für Assets

{: #workspaces}Sie finden Assets in allen Arbeitsbereichen, für die Sie als Mitbearbeiter definiert sind, indem Sie über die Suchleiste für die globale Suche nach dem Asset suchen. Weitere Informationen finden Sie unter Innerhalb der Plattform nach Assets suchen.

Welche Aktionen für Assets möglich sind, hängt vom Assettyp und vom Arbeitsbereichstyp ab.

Projekte Ermöglichen Ihnen und weiteren Mitarbeitern das gemeinsame Arbeiten mit Daten. Sie können zum Beispiel Daten vorbereiten, Daten analysieren oder Modelle in Projekten erstellen. Sie können alle Typen von Assets in Projekten erstellen und Sie können operative Assets ausführen. Weitere Informationen finden Sie unter Projekte.

Kataloge dienen zum Speichern von Assets speichern, die in Ihrer Organisation gemeinsam genutzt werden sollen. Sie können Assets zur Bearbeitung aus Katalogen in Projekte kopieren oder Assets aus Projekten im Katalog publizieren. Sie können alle Typen von Datenassets und einige Typen von operativen Assets in einem Katalog publizieren. In einem Katalog können Sie Metadaten für Assets bearbeiten, Sie können jedoch keine Betriebsassets ausführen. Weitere Informationen finden Sie unter Kataloge.

Bereitstellungsbereiche ermöglichen die Bereitstellung von Modellen oder anderen Assets für die Produktionsumgebung. Sie kopieren bereitstellbare Assets aus Projekten in Bereitstellungsbereiche und erstellen anschließend Bereitstellungen anhand dieser Assets. Weitere Informationen finden Sie unter Bereitstellungsbereiche.

Bei der Datenvirtualisierung erstellen Sie virtuelle Tabellen durch Kombinieren oder Segmentieren einer oder mehrerer Tabellen. Sie veröffentlichen virtuelle Tabellen als Datenassets in einem Katalog. Weitere Informationen finden Sie unter Daten virtualisieren.

Datenassets

Ein Datenasset verweist auf Daten.

Die Vorgehensweise beim Erstellen eines Datenassets hängt davon ab, wo sich die Daten befinden:

  • Wenn sich Ihre Daten in einer Datei befinden, laden Sie die Datei von Ihrem lokalen System in ein Projekt, einen Katalog oder einen Bereitstellungsbereich hoch.
  • Wenn Ihre Daten in einer fernen Datenquelle enthalten sind, erstellen Sie zuerst ein Verbindungsasset, das die Verbindung zu dieser Datenquelle definiert. Anschließend erstellen Sie ein Datenasset, indem Sie die Verbindung, den Pfad oder eine andere Struktur und danach die Tabelle oder Datei auswählen, die die Daten enthält. Dieser Typ der Datenassets wird als _Verbundenes Datenasset_bezeichnet.

Datenassettypen

Datenasset aus einer Datei Ein Datenasset aus einer Datei verweist auf eine Datei, die Sie aus Ihrem lokalen System hochgeladen haben. Die Datei wird im Objektspeichercontainer in der IBM Cloud Object Storage-Instanz gespeichert, die dem Projekt, dem Katalog oder dem Bereitstellungsbereich zugeordnet ist. Der Inhalt der Datei kann strukturierte Daten, unstrukturierte Textdaten, Bilder und andere Datentypen enthalten. Sie können ein Datenasset anhand einer Datei mit beliebigem Format erstellen. Allerdings können Sie für CSV-Dateien mehr Aktionen ausführen als für andere Dateitypen.

Verbundenes Datenasset Ein verbundenes Datenasset verweist auf eine Tabelle, eine Datei oder einen Ordner, auf die bzw. den über eine Verbindung zu einer fernen Datenquelle zugegriffen wird. Die Verbindung ist im Verbindungsasset definiert, das dem verbundenen Datenasset zugeordnet ist. Wenn Sie auf ein verbundenes Datenasset zugreifen, werden die Daten dynamisch aus der Datenquelle abgerufen.

Ein Ordnerdatenasset ist eine spezielle Form eines verbundenen Datenassets. Es verweist auf einen Ordner in IBM Cloud Object Storage. Sie erstellen ein Ordnerdatenasset, indem Sie den Pfad zu dem Ordner und das IBM Cloud Object Storage-Verbindungsasset angeben. Sie können die Dateien und Unterordner anzeigen, die den Pfad mit dem Ordnerdatenasset gemeinsam nutzen. Die Dateien, die Sie in einem Ordnerdatenasset anzeigen können, sind selbst keine Datenassets. Beispiel: Sie können ein Ordnerdatenasset für einen Pfad erstellen, der Newsfeeds enthält, die kontinuierlich aktualisiert werden.

Verbindungsasset Ein Verbindungsasset ist ein bestimmter Datenassettyp. Es enthält die Informationen, die zum Erstellen einer Verbindung zu einer Datenquelle erforderlich sind. Sie können für alle Benutzer, die Zugriff auf das zu verwendende Verbindungsasset haben, gemeinsam genutzte Berechtigungsnachweise bereitstellen, oder Sie können angeben, dass jeder Benutzer seine persönlichen Berechtigungsnachweise eingeben muss, wenn er die Verbindung verwendet. Die Projekte und Kataloge unterstützen viele Verbindungstypen zu Datenquellen von IBM und von anderen Anbietern.

Weitere Informationen finden Sie unter Daten zu einem Projekt hinzufügen, Assets zu einem Katalog hinzufügen und Datenassets zu einem Bereitstellungsbereich hinzufügen.

Operationsassets

{: #tools}Operative Assets bieten Ihnen die Möglichkeit, Daten in Projekten mithilfe von Tools zu bearbeiten, die Daten vorbereiten, Daten analysieren oder Modelle erstellen. Sie erstellen operative Assets mit Tools in Projekten. Ein Jupyter-Notebook beispielsweise ist ein operatives Asset, das Sie mit dem Notebook-Editor-Tool erstellen können, um Daten zu analysieren.

Operative Assets ausführen

Bei der Ausführung von operativen Assets verwenden Sie Rechenressourcen. Rechenressourcen werden in Capacity-Unit-Stunden (capacity unit hours, CUH) gemessen. Abhängig von den Plänen für Ihre Services steht Ihnen eine begrenzte Anzahl von CUH pro Monat zu oder es werden bei Überschreitung einer festgelegten Menge von CUH pro Monat zusätzliche Gebühren fällig.

Bei vielen operativen Assets können Sie hinsichtlich der zu verwendenden Rechenumgebungskonfiguration eine Auswahl treffen. In der Regel führen umfangreichere und schnellere Umgebungskonfigurationen zu einem schnelleren Verbrauch von Rechenressourcen. Weitere Informationen finden Sie unter Umgebungen.

Jedes Ausführen eines Betriebsassets wird als 'Job' bezeichnet. Sie können Jobs überwachen und planen. Weitere Informationen finden Sie unter Jobs.

Typen von operativen Assets

Viele operative Assets werden von den Basisservices bereitgestellt. Für manche operativen Assets sind jedoch andere Services erforderlich.

Mit den Services Watson Studio, Watson Machine Learning und Watson Knowledge Catalog können Sie die folgenden Betriebsassettypen ohne zusätzliche Services erstellen:

  • Data Refinery-Abläufe zum Optimieren (Verfeinern) von Daten mit dem Data Refinery-Tool.
  • Jupyter-Notebooks zum Analysieren von Daten oder Erstellen von Modellen. Sie verwenden den Jupyter-Notebookeditor.
  • SPSS Modeler-Abläufe zum Automatisieren des Datenflusses durch ein Modell mit SPSS-Algorithmen in SPSS Modeler.
  • Decision Optimization-Modelle, zum Erstellen von Lösungen für Szenarios in Decision Optimization Model Builder.
  • AutoAI-Experimente zum Erstellen eines Modells ohne Codierungsaufwand mit dem Tool AutoAI.
  • Deep Learning-Experimente zum Trainieren von Deep Learning-Modellen in Experiment Builder.
  • Metadatenimporte zum Importieren von Assetmetadaten in ein Projekt oder einen Katalog.
  • Metadatenaufbereitungen zum Aufbereiten von Datenassets in einem Projekt mit Ergebnissen der Profilerstellung und der Datenqualitätsanalyse sowie mit Geschäftsbegriffen.

Für die folgenden operativen Assets werden andere Services benötigt. Sie können jeden Service bereitstellen, wenn Sie das erste Asset erstellen, das ihn benötigt:

  • DataStage-Abläufe zum Erstellen von Datentransformationsjobs mit dem Tool DataStage. Erfordert den DataStage-Service.
  • Dashboards zum Visualisieren von Daten ohne Code im Dashboard-Editor. Setzt den Service 'Cognos Dashboards' voraus.

Wenn Sie mit dem Watson Knowledge Catalog-Service ohne Watson Studio arbeiten, können Sie DataRefinery-Abläufe und Metadatenimportassets erstellen.

Konfigurationsassets

{: #config}Konfigurationsassets sind wiederverwendbare Vorlagen in Projekten zum Konfigurieren anderer Assets oder Jobs.

Mit dem Service DataStage können Sie die folgenden Typen von Konfigurationsassets erstellen:

  • Untergeordnete DataStage-Nachrichtenflüsse zum Erfassen einer Gruppe von Stages und Connectors für die Wiederverwendung in DataStage-Datenflüssen.
  • Datendefinitionen zum Angeben der Spaltenmetadaten eines Datenassets für die Wiederverwendung in DataStage-Datenflussjobs.
  • Parametersätze zum Erfassen mehrerer Jobparameter mit angegebenen Werten für die Wiederverwendung in Jobs.

Asseteigenschaften, -metadaten und -beziehungen

{: #properties}Alle Assets weisen allgemeine Metadaten auf, die überall sichtbar sind. Andere Asseteigenschaften variieren je nach Assettyp und Assetstandort.

Allgemeine Eigenschaften

Alle Assets weisen allgemeine Eigenschaften auf, die in Projekten, Katalogen und Bereitstellungsbereichen sichtbar und bearbeitbar sind.

Name Kann bis zu 100 Zeichen enthalten. Unterstützt Mehrbytezeichen. Darf nicht leer sein, darf keine Unicode-Steuerzeichen enthalten bzw. nicht ausschließlich Leerzeichen enthalten. Assetnamen müssen innerhalb eines Projekts oder Bereitstellungsbereichs nicht eindeutig sein. Ob Assetnamen in einem Katalog eindeutig sein müssen, hängt von der für den Katalog festgelegten Methode zur Behandlung von Duplikaten ab.

Beschreibung (Optional). Kann bis zu 245 Zeichen lang sein (Leerzeichen nicht eingeschlossen). Unterstützt Mehrbytezeichen und Hyperlinks.

Tags Nicht regulierte Metadaten, die die Suche nach dem Asset erleichtern. Tags können nur Leerzeichen, Buchstaben, Mehrbytezeichen, Zahlen, Unterstreichungszeichen, Gedankenstriche und die Symbole # und @ enthalten. Projekt-, Katalog- oder Bereitstellungsbereichsmitbearbeiter mit der Administrator- oder Bearbeiterrolle können Tags erstellen und sie Assets hinzufügen.

Automatisch generierte oder erkannte Metadaten können je nach Assettyp weitere Informationen enthalten, unter anderem folgende Informationen: Datum, Größe, Ersteller, letzter Bearbeiter, Zeitpunkt der letzten Änderung, Terminierung, gemeinsame Nutzung, Sprache, Modelltyp und Status.

Weitere Informationen in Katalogen

Assets in Katalogen können weitere Eigenschaften, Beziehungen und Metadaten aufweisen.

Asset-Datenschutz Standardmäßig auf 'public' gesetzt. Diese Einstellung kann den Zugriff auf ein Asset in einem Katalog einschränken, das als 'private' definiert ist. Nur der Eigner und Mitglieder des Assets können private Assets anzeigen und verwenden.

Asseteigner und Assetmitglieder Der Asseteigner ist standardmäßig derjenige Benutzer, der das Asset zum Katalog hinzugefügt hat. Die Assetmitglieder können das Asset anzeigen und verwenden, wenn es als privat markiert ist.

Governance-Artefakte Können automatisch, vom Asseteigner oder von Datenverantworlichen zugeordnet werden. Governance-Artefakte können Assets Metadaten und Beziehungen hinzufügen oder schutzwürdige Daten in Datenassets maskieren.

Angepasste Attribute (Optional). Mit APIs können Sie angepasste Attribute für Assets erstellen.

Bewertungen und Rezensionen Alle Katalogmitarbeiter können Bewertungen und Rezensionen für Assets erstellen.

Weitere Informationen für Datenassets

Abhängig vom Format der Daten in Datenassets werden beim Öffnen des Assets weitere Informationen angezeigt.

Der Pfad zu den Daten Die für den Zugriff auf die Daten erforderlichen Informationen. Ein verbundenes Datenasset für eine Tabelle in einer Datenbank enthält eine Referenz auf das Verbindungsasset für die Datenbank, das Schema oder andere Pfadinformationen sowie den Tabellennamen. Ein Datenasset für eine Uploaddatei enthält eine Referenz auf die Dateiposition im Objektspeichercontainer für das Projekt, den Katalog oder den Bereitstellungsbereich.

Dateiformat Der MIME-Typ für eine Datei. Es wird automatisch erkannt.

Datenvorschau Eine Vorschau der Daten für CSV-, Avro-, Parquet-, Microsoft Excel-, PDF-, Text- und Bilddateien.

Datenprofil Ein Profil der Daten für CSV-, Avro-, Parquet-, Microsoft Word-, PDF-, Text- und HTML-Dateien.

Aktivitäten Das Verlaufsprotokoll der Aktivitäten, die für das Asset in Projekten und Katalogen ausgeführt wurden. Ob Sie Aktivitäten anzeigen können, hängt von Ihrem Watson Knowledge Catalog-Angebotsplan ab.

Weitere Informationen

Übergeordneter Abschnitt: Übersicht über IBM Cloud Pak for Data as a Service