0 / 0
Zurück zur englischen Version der Dokumentation
Assettypen und -eigenschaften
Assettypen und -eigenschaften

Assettypen und -eigenschaften

Ein Element Asset enthält Metadaten für Daten sowie weitere Informationstypen oder ausführbaren Code. Sie arbeiten mit Assets in der gesamten Cloud Pak for Data-Plattform, einschließlich der Hauptarbeitsbereiche: Projekte, Kataloge und Bereitstellungsbereiche.

Um ein Verständnis für Assets zu entwickeln, müssen Sie die verschiedenen Typen von Assets, ihre Eigenschaften und ihren Standort kennen:

Arbeitsbereiche für Assets

Sie finden Assets in allen Arbeitsbereichen, für die Sie als Mitbearbeiter definiert sind, indem Sie über die Suchleiste für die globale Suche nach dem Asset suchen. Siehe Plattformweit nach Assets suchen.

Welche Aktionen für Assets möglich sind, hängt vom Assettyp und vom Arbeitsbereichstyp ab.

Projekte Ermöglichen Ihnen und weiteren Mitarbeitern das gemeinsame Arbeiten mit Daten. Sie können zum Beispiel Daten vorbereiten, Daten analysieren oder Modelle in Projekten erstellen. Sie können alle Typen von Assets in Projekten erstellen und Sie können operative Assets ausführen. Siehe Projekte.

Kataloge dienen zum Speichern von Assets speichern, die in Ihrer Organisation gemeinsam genutzt werden sollen. Sie können Assets zur Bearbeitung aus Katalogen in Projekte kopieren oder Assets aus Projekten im Katalog publizieren. Sie können alle Typen von Datenassets und einige Typen von operativen Assets in einem Katalog publizieren. In einem Katalog können Sie Metadaten für Assets bearbeiten, Sie können jedoch keine Betriebsassets ausführen. Siehe Kataloge.

Bereitstellungsbereiche ermöglichen die Bereitstellung von Modellen oder anderen Assets für die Produktionsumgebung. Sie kopieren bereitstellbare Assets aus Projekten in Bereitstellungsbereiche und erstellen anschließend Bereitstellungen anhand dieser Assets. Weitere Informationen finden Sie unter Bereitstellungsbereiche.

Bei der Datenvirtualisierung erstellen Sie virtuelle Tabellen durch Kombinieren oder Segmentieren einer oder mehrerer Tabellen. Sie veröffentlichen virtuelle Tabellen als Datenassets in einem Katalog. Siehe Daten virtualisieren.

Datenassets

Datenassets enthalten Metadaten zu Daten, einschließlich des Zugriffs auf die Daten.

Die Vorgehensweise beim Erstellen eines Datenassets hängt davon ab, wo sich die Daten befinden:

  • Wenn sich Ihre Daten in einer Datei befinden, laden Sie die Datei von Ihrem lokalen System in ein Projekt, einen Katalog oder einen Bereitstellungsbereich hoch.
  • Wenn Ihre Daten in einer fernen Datenquelle enthalten sind, erstellen Sie zuerst ein Verbindungsasset, das die Verbindung zu dieser Datenquelle definiert. Anschließend erstellen Sie ein Datenasset, indem Sie die Verbindung, den Pfad oder eine andere Struktur und danach die Tabelle oder Datei auswählen, die die Daten enthält. Dieser Typ der Datenassets wird als Verbundenes Datenassetbezeichnet.

Datenassettypen

Datenasset aus einer Datei Ein Datenasset aus einer Datei verweist auf eine Datei, die Sie aus Ihrem lokalen System hochgeladen haben. Die Datei wird im Objektspeichercontainer in der IBM Cloud Object Storage-Instanz gespeichert, die dem Projekt, dem Katalog oder dem Bereitstellungsbereich zugeordnet ist. Der Inhalt der Datei kann strukturierte Daten, unstrukturierte Textdaten, Bilder und andere Datentypen enthalten. Sie können ein Datenasset anhand einer Datei mit beliebigem Format erstellen. Allerdings können Sie für CSV-Dateien mehr Aktionen ausführen als für andere Dateitypen.

Verbundenes Datenasset Ein verbundenes Datenasset verweist auf eine Tabelle, eine Datei oder einen Ordner, auf die bzw. den über eine Verbindung zu einer fernen Datenquelle zugegriffen wird. Die Verbindung ist im Verbindungsasset definiert, das dem verbundenen Datenasset zugeordnet ist. Wenn Sie auf ein verbundenes Datenasset zugreifen, werden die Daten dynamisch aus der Datenquelle abgerufen.

Ein Ordnerdatenasset ist eine spezielle Form eines verbundenen Datenassets. Es verweist auf einen Ordner in IBM Cloud Object Storage. Sie erstellen ein Ordnerdatenasset, indem Sie den Pfad zu dem Ordner und das IBM Cloud Object Storage-Verbindungsasset angeben. Sie können die Dateien und Unterordner anzeigen, die den Pfad mit dem Ordnerdatenasset gemeinsam nutzen. Die Dateien, die Sie in einem Ordnerdatenasset anzeigen können, sind selbst keine Datenassets. Beispiel: Sie können ein Ordnerdatenasset für einen Pfad erstellen, der Newsfeeds enthält, die kontinuierlich aktualisiert werden.

Verbindungsasset Ein Verbindungsasset ist ein bestimmter Datenassettyp. Es enthält die Informationen, die zum Erstellen einer Verbindung zu einer Datenquelle erforderlich sind. Sie können für alle Benutzer, die Zugriff auf das zu verwendende Verbindungsasset haben, gemeinsam genutzte Berechtigungsnachweise bereitstellen, oder Sie können angeben, dass jeder Benutzer seine persönlichen Berechtigungsnachweise eingeben muss, wenn er die Verbindung verwendet. Die Projekte und Kataloge unterstützen viele Verbindungstypen sowohl für IBM als auch für Datenquellen von Drittanbietern.

Weitere Informationen finden Sie unter Daten zu einem Projekt hinzufügen, Assets zu einem Katalog hinzufügen und Datenassets zu einem Bereitstellungsbereich hinzufügen.

Operationsassets

Operative Assets bieten Ihnen die Möglichkeit, Daten in Projekten mithilfe von Tools zu bearbeiten, die Daten vorbereiten, Daten analysieren oder Modelle erstellen. Sie erstellen operative Assets mit Tools in Projekten. Ein Jupyter-Notebook beispielsweise ist ein operatives Asset, das Sie mit dem Notebook-Editor-Tool erstellen können, um Daten zu analysieren.

Operative Assets ausführen

Bei der Ausführung von operativen Assets verwenden Sie Rechenressourcen. Rechenressourcen werden in Capacity-Unit-Stunden (capacity unit hours, CUH) gemessen. Abhängig von den Plänen für Ihre Services steht Ihnen eine begrenzte Anzahl von CUH pro Monat zu oder es werden bei Überschreitung einer festgelegten Menge von CUH pro Monat zusätzliche Gebühren fällig.

Bei vielen operativen Assets können Sie hinsichtlich der zu verwendenden Rechenumgebungskonfiguration eine Auswahl treffen. In der Regel führen umfangreichere und schnellere Umgebungskonfigurationen zu einem schnelleren Verbrauch von Rechenressourcen. Weitere Informationen finden Sie unter Umgebungen.

Jedes Ausführen eines Betriebsassets wird als 'Job' bezeichnet. Sie können Jobs überwachen und planen. Siehe Jobs.

Typen von operativen Assets

Viele operative Assets werden von den Basisservices bereitgestellt. Für manche operativen Assets sind jedoch andere Services erforderlich.

Sie können diese Typen von Betriebsanlagen ohne zusätzliche Services erstellen:

  • Data Refinery-Abläufe, um Daten mit dem Tool 'Data Refinery' zu verfeinern.
  • Jupyter-Notebooks, um Daten zu analysieren oder Modelle zu erstellen. Sie verwenden den Jupyter-Notebookeditor.
  • SPSS Modeler-Abläufe, um den Datenfluss durch ein Modell mit SPSS-Algorithmen in SPSS Modeler zu automatisieren.
  • Decision Optimization-Modelle, um Szenarios im Erstellungsprogramm für Decision Optimization-Modelle zu lösen.
  • AutoAI-Experimente, um ein Modell ohne Schreiben von Code im AutoAI-Tool zu erstellen.

  • Metadatenimporte, um Assetmetadaten in ein Projekt oder einen Katalog zu importieren.

  • Metadatenaufbereitungen zum Aufbereiten von Datenassets in einem Projekt mit Ergebnissen der Profilerstellung und der Datenqualitätsanalyse sowie mit Geschäftsbegriffen.

Für die folgenden operativen Assets werden andere Services benötigt. Sie können jeden Service bereitstellen, wenn Sie das erste Asset erstellen, das ihn benötigt:

  • DataStage-Abläufe, um mit dem DataStage-Tool Datentransformationsjobs zu erstellen. Erfordert den DataStage-Service.
  • Dashboards, um Daten ohne Code im Dashboard-Editor zu visualisieren. Setzt den Service 'Cognos Dashboards' voraus.

Wenn Sie über den Service Watson Knowledge Catalog ohne Watson Studioverfügen, können Sie Data Refinery -Abläufe, Metadatenimportassets und Assets für die Metadatenaufbereitung erstellen.

Konfigurationsassets

Konfigurationsassets sind wiederverwendbare Vorlagen in Projekten zum Konfigurieren anderer Assets oder Jobs.

Mit dem Service DataStage können Sie die folgenden Typen von Konfigurationsassets erstellen:

  • Untergeordnete DataStage-Nachrichtenflüsse zum Erfassen einer Gruppe von Stages und Connectors für die Wiederverwendung in DataStage-Datenflüssen.
  • Datendefinitionen zum Angeben der Spaltenmetadaten eines Datenassets für die Wiederverwendung in DataStage-Datenflussjobs.
  • Parametersätze zum Erfassen mehrerer Jobparameter mit angegebenen Werten für die Wiederverwendung in Jobs.

Beschreibende Assets

Beschreibende Assets beschreiben die Struktur von Geschäftsberichten oder Datenmodellen, die in externen Tools und Datentransformationen verwaltet werden.

COBOL-Copybooks

COBOL-Copybooks beschreiben die Datenstruktur eines COBOL-Programms. Sie können nicht profiliert, durch Metadatenanreicherung aufbereitet oder in Data Refinery verwendet werden.

Asseteigenschaften, -metadaten und -beziehungen

Alle Assets weisen allgemeine Metadaten auf, die überall sichtbar sind. Andere Asseteigenschaften variieren je nach Assettyp und Assetstandort.

Allgemeine Eigenschaften

Alle Assets haben allgemeine Eigenschaften, die in Projekten, Katalogen und Bereitstellungsbereichen sichtbar und bearbeitbar sind.

Name Kann bis zu 100 Zeichen enthalten. Unterstützt Mehrbytezeichen. Darf nicht leer sein, darf keine Unicode-Steuerzeichen enthalten bzw. nicht ausschließlich Leerzeichen enthalten. Assetnamen müssen innerhalb eines Projekts oder Bereitstellungsbereichs nicht eindeutig sein. Ob Assetnamen in einem Katalog eindeutig sein müssen, hängt von der für den Katalog festgelegten Methode zur Behandlung von Duplikaten ab.

Beschreibung (Optional). Kann bis zu 245 Zeichen lang sein (Leerzeichen nicht eingeschlossen). Unterstützt Mehrbytezeichen und Hyperlinks.

Automatisch generierte oder erkannte Metadaten können je nach Assettyp weitere Informationen enthalten, unter anderem folgende Informationen: Datum, Größe, Ersteller, letzter Bearbeiter, Zeitpunkt der letzten Änderung, Terminierung, gemeinsame Nutzung, Sprache, Modelltyp und Status.

Einige Assettypen können Tags haben, bei denen es sich um nicht regulierten Metadaten handelt, die die Suche nach dem Asset vereinfachen. Tags können nur Leerzeichen, Buchstaben, Mehrbytezeichen, Zahlen, Unterstreichungszeichen, Gedankenstriche und die Symbole # und @ enthalten. Projekt-, Katalog- oder Bereitstellungsbereichsmitbearbeiter mit der Administrator- oder Bearbeiterrolle können Tags erstellen und sie Assets hinzufügen.

Weitere Informationen zu Assets

Assets können mehr Eigenschaften, Beziehungen und Metadaten haben.

Asset-Datenschutz Standardmäßig auf 'public' gesetzt. Diese Einstellung kann den Zugriff auf ein Asset in einem Katalog einschränken, das als 'private' definiert ist. Nur der Eigner und Mitglieder des Assets können private Assets anzeigen und verwenden.

Asseteigner und Assetmitglieder Der Asseteigner ist standardmäßig derjenige Benutzer, der das Asset zum Katalog hinzugefügt hat. Die Assetmitglieder können das Asset anzeigen und verwenden, wenn es als privat markiert ist.

Governance-Artefakte Können automatisch, vom Asseteigner oder von Datenverantworlichen zugeordnet werden. Governance-Artefakte können Assets Metadaten und Beziehungen hinzufügen oder schutzwürdige Daten in Datenassets maskieren. Im Allgemeinen sind diese Informationen in Katalogen verfügbar. Für einige Assettypen sind diese Informationen auch in Projekten verfügbar.

Angepasste Eigenschaften Optional. Angepasste Eigenschaften werden im Abschnitt Details auf der Registerkarte Übersicht des Assets im Katalog angezeigt. Sie können angepasste Eigenschaften für Assets erstellen. Weitere Informationen finden Sie unter Angepasste Eigenschaften und Beziehungen für Glossarartefakte und Katalogassets.

Beziehungen Optional. Kann zwischen Assets in demselben Arbeitsbereich oder in verschiedenen Arbeitsbereichen liegen. Sie können beispielsweise eine Beziehung zwischen einem Asset in einem Katalog und einem Asset in einem Projekt hinzufügen. Administratoren können angepasste Beziehungen für Assets erstellen. Weitere Informationen finden Sie unter Assetbeziehungen hinzufügen.

Assetvorschau Eine Vorschau eines Assets. Der in einer Vorschau angezeigte Inhalt hängt vom Typ des Assets, der Datei oder der Daten ab.

Bewertungen und Rezensionen Alle Katalogmitarbeiter können Bewertungen und Rezensionen für Assets erstellen.

Weitere Informationen für Datenassets

Abhängig vom Format der Daten in Datenassets werden beim Öffnen des Assets weitere Informationen angezeigt.

Der Pfad zu den Daten Die für den Zugriff auf die Daten erforderlichen Informationen. Ein verbundenes Datenasset für eine Tabelle in einer Datenbank enthält eine Referenz auf das Verbindungsasset für die Datenbank, das Schema oder andere Pfadinformationen sowie den Tabellennamen. Ein Datenasset für eine Uploaddatei enthält eine Referenz auf die Dateiposition im Objektspeichercontainer für das Projekt, den Katalog oder den Bereitstellungsbereich.

Dateiformat Der MIME-Typ für eine Datei. Es wird automatisch erkannt.

Datenprofil Ein Datenprofil für Daten aus relationalen Datenquellen sowie für CSV-, TSV-, Avro-, Parquet-, Microsoft Word-, Microsoft Excel-(nur das erste Arbeitsblatt in einer Arbeitsmappe), PDF-, Text-und HTML-Dateien.

Aktivitäten Das Protokoll von Aktivitäten , das für das Asset in Projekten und Katalogen ausgeführt wird. Ob Sie Aktivitäten anzeigen können, hängt von Ihrem Watson Knowledge Catalog -Angebotsplanab.

Weitere Informationen

Übergeordnetes Thema: Übersicht über IBM Cloud Pak for Data as a Service