Assettypen und -eigenschaften
Die Plattform stellt Arbeitsbereiche und Tools für Onlinezusammenarbeit bereit und Sie stellen der Plattform den Inhalt in Form von Assets zur Verfügung. Ein Asset ist ein Element, das Informationen zu Daten, andere wertvolle Informationen oder Code enthält, der mit Daten arbeitet.
Sie fügen Assets hinzu, indem Sie sie importieren oder mit Tools erstellen. Sie arbeiten mit Assets in Arbeitsbereichen mit Onlinezusammenarbeit. Der von Ihnen verwendete Arbeitsbereich hängt von Ihren Tasks ab.
- Projekte
- Wo Sie mit anderen zusammenarbeiten, um mit Daten zu arbeiten und Assets zu erstellen. Die meisten Tools befinden sich in Projekten und Sie führen Assets aus, die Code in Projekten enthalten. Sie können beispielsweise Daten importieren, Daten vorbereiten, Daten analysieren oder Modelle in Projekten erstellen. Siehe Projekte.
- Kataloge
- Hier können Sie Assets speichern, die Sie mit Ihrer Organisation gemeinsam nutzen möchten, oder nach Assets suchen, mit denen Sie arbeiten müssen. Sie können Assets aus Katalogen in Projekte kopieren oder Assets aus Projekten im Katalog publizieren. Sie können Asseteigenschaften und Metadaten in einem Katalog bearbeiten, aber keine Assets ausführen. Siehe Kataloge.
- Bereitstellungsbereiche
- Wo Sie Assets implementieren und ausführen, die für Tests oder Produktion bereit sind. Sie verschieben Assets aus Projekten in Bereitstellungsbereiche und erstellen anschließend Bereitstellungen aus diesen Assets. Sie überwachen und aktualisieren Implementierungen nach Bedarf. Weitere Informationen finden Sie unter Bereitstellungsbereiche.
Die folgende Abbildung veranschaulicht, wie Sie Assets auf der Plattform verschieben.
Sie finden Assets in allen Arbeitsbereichen, für die Sie als Mitbearbeiter definiert sind, indem Sie über die Suchleiste für die globale Suche nach dem Asset suchen. Siehe Plattformweit nach Assets suchen.
Sie können viele verschiedene Assettypen erstellen, aber alle Assets haben einige gemeinsame Eigenschaften:
Assettypen
Zum Erstellen der meisten Assettypen müssen Sie ein bestimmtes Tool verwenden. Die meisten Tools werden von einem oder mehreren Services bereitgestellt. Die Tools zum Erstellen von Datenassets und Verbindungsassets werden von der Plattform bereitgestellt und erfordern keine bestimmten Services.
Um zu sehen, welche Services Sie für welche Tools benötigen, öffnen Sie die Karte für Tools und Services.
In der folgenden Tabelle werden die Typen von Assets aufgelistet, die Sie erstellen können, die Tools, die Sie zum Erstellen benötigen, und die Arbeitsbereiche, in denen Sie sie hinzufügen können.
Assettyp | Beschreibung | Tools zum Erstellen | Arbeitsbereiche |
---|---|---|---|
AutoAI-Experiment | Generiert automatisch potenzielle Pipelines für Vorhersagemodelle. | AutoAI | Projekte |
COBOL-Copybook | Zeigen Sie die Mapmetadaten für verbundene Datenassets von z/OS -Mainframe-Computern an. | Tool Metadata import | Projekte, Kataloge |
Verbundenes Datenasset | Stellt Daten dar, auf die über eine Verbindung zu einer fernen Datenquelle zugegriffen wird. | Verbundenes Datentool, Tool Metadata import | Projekte, Kataloge, Bereiche |
Connection | Enthält die Informationen für die Verbindung zu einer Datenquelle. | Verbindungstool | Projekte, Kataloge, Bereiche |
dashboard | Visualisiert Daten in interaktiven Diagrammen ohne Code. | Dashboard-Editor | Projekte, Kataloge |
Datenasset aus Datei | Stellt eine Datei dar, die Sie von Ihrem lokalen System hochgeladen haben | Teilfenster 'Hochladen' | Projekte, Kataloge, Bereiche |
Data Refinery-Ablauf | Bereitet Daten vor. | Data Refinery | Projekte, Bereiche |
DatenflussData Replication | Repliziert Daten. | Data Replication | Projekte, Kataloge |
Datenqualitätsdefinition | Definiert eine wiederverwendbare Regellogikkomponente für Datenqualitätsregeln. | Editor für Datenqualitätsdefinitionen | Projekte, Kataloge |
Datenqualitätsregel | Bewertet die Datenqualität für bestimmte Bedingungen. | Regeleditor für Datenqualität | Projekte |
DataStage-Datendefinitionen | Definiert eine wiederverwendbare Spaltenmetadatenkomponente für DataStage -Ablaufjobs. | DataStage -Komponenteneditor | Projekte, Bereiche |
DataStage-Fluss | Transformiert und integriert Daten. | DataStage-Ablaufeditor | Projekte, Bereiche |
DataStage-Schemabibliothek | Importiert eine wiederverwendbare Gruppe von Ressourcen für DataStage -Abläufe. | DataStage -Komponenteneditor | Projekte, Bereiche |
DataStage-Standardisierungsregel | Definiert eine wiederverwendbare Regelkomponente zum Formatieren von Daten in DataStage -Abläufen. | DataStage -Komponenteneditor | Projekte, Bereiche |
DataStage-Unterablauf | Definiert eine wiederverwendbare Gruppe von Stages und Connectors für DataStage -Abläufe. | DataStage -Komponenteneditor | Projekte, Bereiche |
Decision Optimization-Experiment | Löst Optimierungsprobleme. | Decision Optimization | Projekte |
Experiment für föderiertes Lernen | Trainiert ein allgemeines Modell für eine Gruppe ferner Datenquellen | Federated Learning | Projekte |
Ordnerasset | Stellt einen Ordner in IBM Cloud Object Storagedar | Tool für verbundene Daten | Projekte, Kataloge, Bereiche |
Jupyter-Notebook | Führt Python -oder R-Code aus, um Daten zu analysieren oder Modelle zu erstellen. | Editor für Jupyter-Notebooks | Projekte, Kataloge |
Maskierungsablauf | Erstellt maskierte Kopien von Datenassets. | Maskierungsablauf | Projekte |
Konfiguration der Masterdaten | Konfiguriert Match 360. | Match 360 | Projekte |
Metadatenaufbereitung | Bereichert importierte Assetmetadaten. | Tool für Metadatenaufbereitung | Projekte |
Metadata import | Importiert Assetmetadaten aus einer Verbindung. | Tool Metadata import | Projekte |
Modell | Enthält Informationen zu einem gespeicherten oder importierten Modell. | Verschiedene Tools, die Experimente ausführen oder Modelle trainieren | Projekte, Kataloge, Bereiche |
Modellanwendungsfall | Verfolgt den Lebenszyklus eines Modells von der Anforderung bis zur Produktion. | AI Factsheets | Kataloge |
Parametersatz | Erfasst eine wiederverwendbare Gruppe von Jobparametern für DataStage -Jobs. | Parametersatzeditor | Projekte |
Pipeline | Automatisiert den Modelllebenszyklus. | Watson Pipelines | Projekte |
Python-Funktion | Enthält Python -Code zur Unterstützung eines Modells in der Produktion. | Editor für Jupyter-Notebooks | Projekte, Bereiche |
script | Enthält Python -oder R-Scripts zur Unterstützung eines Modells in der Produktion. | Jupyter-Notebookeditor, RStudio | Projekte, Bereiche |
SPSS Modeler-Abläufe | Führt einen Ablauf aus, um Daten vorzubereiten und ein Modell zu erstellen. | SPSS Modeler | Projekte |
Visualisierung | Zeigt Visualisierungen aus einem Datenasset an. | Seite Visualisierung in Datenassets | Projekte |
Allgemeine Eigenschaften für Assets
Assets sammeln Informationen in Eigenschaften, wenn Sie sie erstellen, verwenden oder wenn sie von automatisierten Prozessen aktualisiert werden. Einige Eigenschaften werden von Benutzern bereitgestellt und können von Benutzern bearbeitet werden. Andere Eigenschaften werden automatisch vom System bereitgestellt. Die meisten vom System bereitgestellten Eigenschaften können nicht von Benutzern bearbeitet werden.
Allgemeine Eigenschaften für Assets überall
Die meisten Assettypen verfügen über die Eigenschaften, die in der folgenden Tabelle in allen Arbeitsbereichen aufgelistet sind, in denen diese Assettypen vorhanden sind.
Eigenschaft | Beschreibung | Bearbeitbar? |
---|---|---|
Name | Der Assetname. Kann bis zu 100 Zeichen lang sein. Unterstützt Mehrbytezeichen. Darf nicht leer sein, darf keine Unicode-Steuerzeichen enthalten bzw. nicht ausschließlich Leerzeichen enthalten. Assetnamen müssen innerhalb eines Projekts oder Bereitstellungsbereichs nicht eindeutig sein. Ob Assetnamen in einem Katalog eindeutig sein müssen, hängt von der für den Katalog festgelegten Methode zur Behandlung von Duplikaten ab. | Ja |
Beschreibung | Optional. Kann bis zu 245 Zeichen lang sein (Leerzeichen nicht eingeschlossen). Unterstützt Mehrbytezeichen und Hyperlinks. | Ja |
Erstellungsdatum | Die Zeitmarke der Erstellung oder des Imports des Assets. | Nein |
Ersteller oder Eigner | Der Benutzername oder die E-Mail-Adresse der Person, die das Asset erstellt bzw. importiert hat | Nein |
Datum der letzten Änderung | Die Zeitmarke der letzten Änderung des Assets. | Nein |
Letzter Bearbeiter | Der Benutzername oder die E-Mail-Adresse der Person, die das Asset zuletzt geändert hat. | Nein |
Allgemeine Eigenschaften für Assets in Katalogen
Zusätzlich zu den allgemeinen Eigenschaften, die alle Assets haben, haben Assets in Katalogen die Eigenschaften und Seiten, die in der folgenden Tabelle aufgelistet sind.
Eigenschaft oder Seite | Beschreibung | Bearbeitbar? |
---|---|---|
Seite Asset | Eine Ansicht des Inhalts des Assets. Siehe Assetinhalt oder Vorschau. | Nein |
Datenschutz | Ist standardmäßig auf 'öffentlich' gesetzt. Diese Einstellung kann den Zugriff auf ein Asset in einem Katalog einschränken, wenn sie auf "Privat" gesetzt ist. Nur der Eigner und Mitglieder des Assets können private Assets anzeigen und verwenden. | Ja |
Seite Zugriff | Der Eigner und die Mitglieder des Assets Der Asseteigner ist standardmäßig der Benutzer, der das Asset dem Katalog hinzugefügt hat. Die Assetmitglieder können das Asset anzeigen und verwenden, wenn es als privat markiert ist. Informationen hierzu finden Sie in Zugriff auf Asset steuern. | Ja |
Seite Bewertungen | Optional. Katalogmitarbeiter können Assets bewerten und prüfen. | Ja |
Tags | Optional. Textbezeichnungen, die von Katalogmitarbeitern erstellt werden, um die Suche zu erleichtern. Ein Tag besteht aus einer Zeichenfolge mit bis zu 255 Zeichen. Sie kann Leerzeichen, Buchstaben, Zahlen, Unterstreichungszeichen, Gedankenstriche und die Symbole # und @ enthalten. | Ja |
Beziehungen | Optional. Beziehungen, die im Abschnitt Zugehörige Elemente der Seite Übersicht des Assets angezeigt werden, dienen nur zur Information und haben keine weiteren Auswirkungen auf das Asset. Kann zwischen Assets in demselben Arbeitsbereich oder in verschiedenen Arbeitsbereichen liegen. Sie können beispielsweise eine Beziehung zwischen einem Asset in einem Katalog und einem Asset in einem Projekt hinzufügen. Kann zwischen einem Asset und einem Artefakt liegen. Sie können beispielsweise eine Beziehung zwischen einem Asset und einer Richtlinie hinzufügen. Administratoren können angepasste Beziehungen für Assets erstellen. Weitere Informationen finden Sie unter Assetbeziehungen hinzufügen. | Ja |
Governance-Artefakte | Optional. Die Geschäftsbegriffe und die Klassifikation, die Benutzer dem Asset zugeordnet haben Diese Zuordnungen können sich auf das Asset auswirken. Ein zugewiesener Geschäftsbegriff kann beispielsweise die Durchsetzung einer Datenschutzregel auslösen. | Ja |
Sie können angepasste Eigenschaften für Assettypen erstellen. Angepasste Eigenschaften werden im Abschnitt Details auf der Registerkarte Übersicht des Assets im Katalog angezeigt. Siehe Angepasste Eigenschaften und Beziehungen.
Zum Bearbeiten von Asseteigenschaften müssen Sie über die erforderlichen Berechtigungen verfügen. Siehe Assets in einem Katalog bearbeiten.
Allgemeine Eigenschaften für Assets, die in Tools ausgeführt werden
Einige Assets sind der Ausführung eines Tools zugeordnet. Beispiel: Ein AutoAI -Experimentasset wird im Tool AutoAI ausgeführt. Assets, die in Tools ausgeführt werden, werden auch als Betriebsassets bezeichnet. Jedes Mal, wenn Sie Assets in Tools ausführen, starten Sie einen Job. Sie können Jobs überwachen und planen. Jobs verwenden Rechenressourcen. Rechenressourcen werden in Capacity-Unit-Stunden (capacity unit hours, CUH) gemessen. Abhängig von Ihren Serviceplänen können Sie einen begrenzten Betrag von CUH pro Monat haben oder für die CUH bezahlen, die Sie jeden Monat nutzen.
Für viele Assets, die in Tools ausgeführt werden, können Sie die zu verwendende Konfiguration der Berechnungsumgebung auswählen. In der Regel führen umfangreichere und schnellere Umgebungskonfigurationen zu einem schnelleren Verbrauch von Rechenressourcen.
Neben Basiseigenschaften enthalten die meisten Assets, die in Tools ausgeführt werden, die folgenden Typen von Informationen in Projekten:
Eigenschaften | Beschreibung | Bearbeitbar? | Arbeitsbereiche |
---|---|---|---|
Umgebungsdefinition | Die Umgebungsvorlage, Hardwarespezifikation und Softwarespezifikation für die Ausführung des Assets. Weitere Informationen finden Sie unter Umgebungen. | Ja | Projekte, Bereiche |
Einstellungen | Informationen, die definieren, wie die Anlage ausgeführt wird Spezifisch für jeden Assettyp | Ja | Projekte |
Zugeordnete Datenassets | Die Daten, an denen das Asset arbeitet. | Ja | Projekte |
Jobs | Informationen zur Ausführung des Assets, einschließlich der Umgebungsdefinition, des Zeitplans und der Benachrichtigungsoptionen. Weitere Informationen finden Sie unter Jobs. | Ja | Projekte, Bereiche |
Datenassettypen und ihre Eigenschaften
Datenassettypen enthalten Metadaten und andere Informationen zu Daten, einschließlich des Zugriffs auf die Daten.
Die Vorgehensweise beim Erstellen eines Datenassets hängt davon ab, wo sich die Daten befinden:
- Wenn sich Ihre Daten in einer Datei befinden, laden Sie die Datei von Ihrem lokalen System in ein Projekt, einen Katalog oder einen Bereitstellungsbereich hoch.
- Wenn Ihre Daten in einer fernen Datenquelle enthalten sind, erstellen Sie zuerst ein Verbindungsasset, das die Verbindung zu dieser Datenquelle definiert. Anschließend erstellen Sie ein Datenasset, indem Sie die Verbindung, den Pfad oder eine andere Struktur sowie die Tabelle oder Datei auswählen, die die Daten enthält. Dieser Typ der Datenassets wird als Verbundenes Datenassetbezeichnet.
Die folgende Abbildung zeigt, wie Datenassets aus Dateien auf hochgeladene Dateien in Cloud Object Storageverweisen. Verbundene Datenassets erfordern ein Verbindungsasset und verweisen auf Daten in einer fernen Datenquelle.
Sie können die folgenden Typen von Datenassets in einem Projekt, Katalog oder Bereitstellungsbereich erstellen:
- Datenasset aus Datei
- Stellt eine Datei dar, die Sie von Ihrem lokalen System hochgeladen haben Die Datei wird im Objektspeichercontainer in der IBM Cloud Object Storage -Instanz gespeichert, die dem Arbeitsbereich zugeordnet ist. Der Inhalt der Datei kann strukturierte Daten, unstrukturierte Textdaten, Bilder und andere Datentypen enthalten. Sie können ein Datenasset anhand einer Datei mit beliebigem Format erstellen. Allerdings können Sie für CSV-Dateien mehr Aktionen ausführen als für andere Dateitypen. Siehe Eigenschaften von Datenassets.
- Sie können Datenassets aus einer Datei erstellen, indem Sie eine Datei in einen Arbeitsbereich hochladen. Sie können Datendateien auch mit Tools erstellen und in Assets konvertieren. Sie können beispielsweise Datenassets aus Dateien mit den Tools Data Refinery, Jupyter Notebook und RStudio erstellen.
- Verbundenes Datenasset
- Stellt eine Tabelle, eine Datei oder einen Ordner dar, auf die bzw. den über eine Verbindung zu einer fernen Datenquelle zugegriffen wird. Die Verbindung ist im Verbindungsasset definiert, das dem verbundenen Datenasset zugeordnet ist. Sie können ein verbundenes Datenasset für jede unterstützte Verbindung erstellen. Wenn Sie auf ein verbundenes Datenasset zugreifen, werden die Daten dynamisch aus der Datenquelle abgerufen. Siehe Eigenschaften von Datenassets.
- Sie können verbundene Datenassets aus einer Datenquelle mit dem verbundenen Datentool in einem Arbeitsbereich importieren. Wenn Sie den Import nach einem Zeitplan erneut ausführen möchten, verwenden Sie das Metadatenimporttool in Projekten. Sie können virtuelle Tabellen erstellen, die Daten aus mehreren Datenquellen mit Watson Query im Arbeitsbereich Data virtualization kompilieren.
- Ordnerasset
- Stellt einen Ordner in IBM Cloud Object Storagedar Ein Ordnerdatenasset ist ein Sonderfall eines verbundenen Datenassets. Sie erstellen ein Ordnerdatenasset, indem Sie den Pfad zu dem Ordner und das IBM Cloud Object Storage-Verbindungsasset angeben. Sie können die Dateien und Unterordner anzeigen, die den Pfad mit dem Ordnerdatenasset gemeinsam nutzen. Die Dateien, die Sie in einem Ordnerdatenasset anzeigen können, sind selbst keine Datenassets. Beispiel: Sie können ein Ordnerdatenasset für einen Pfad erstellen, der Newsfeeds enthält, die kontinuierlich aktualisiert werden. Siehe Eigenschaften von Datenassets.
- Sie können Ordnerassets aus IBM Cloud Object Storage mit dem verbundenen Datentool in einem Arbeitsbereich importieren.
- Verbindungsasset
- Enthält die Informationen, die erforderlich sind, um eine Verbindung zu einer Datenquelle herzustellen. Siehe Eigenschaften von Verbindungsassets.
- Sie können Verbindungen mit dem Verbindungstool in einem Arbeitsbereich erstellen.
Weitere Informationen zum Erstellen und Importieren von Datenassets:
- Daten einem Projekt hinzufügen
- Assets einem Katalog hinzufügen
- Datenassets zu einem Bereitstellungsbereich hinzufügen- Daten virtualisieren
Eigenschaften von Datenassets aus Dateien und verbundenen Datenassets
Neben Basiseigenschaften und allgemeinen Katalogeigenschaften verfügen Datenassets aus Dateien und verbundenen Datenassets über die Eigenschaften oder Seiten, die in der folgenden Tabelle aufgelistet sind.
Eigenschaft oder Seite | Beschreibung | Bearbeitbar? | Arbeitsbereiche |
---|---|---|---|
Spalten | Eine Zusammenfassung der Eigenschaften der Spalten im Datenasset. Enthält den Qualitätsscore, die Beschreibung, die zugeordneten Datenklassen und die zugeordneten Geschäftsbegriffe für jede Spalte. Die zugeordneten Datenklassen und Geschäftsbegriffe können sich auf das Asset auswirken. Ein zugewiesener Geschäftsbegriff kann beispielsweise die Durchsetzung einer Datenschutzregel auslösen. | Nein | Kataloge |
Tags | Optional. Textbeschriftungen, die Benutzer erstellen, um die Suche zu erleichtern. Ein Tag besteht aus einer Zeichenfolge mit bis zu 255 Zeichen. Sie kann Leerzeichen, Buchstaben, Zahlen, Unterstreichungszeichen, Gedankenstriche und die Symbole # und @ enthalten. | Ja | Projekte, Kataloge |
Format | Der MIME-Typ einer Datei. Es wird automatisch erkannt. | Ja | Projekte, Kataloge, Bereiche |
Quelle | Informationen zur Datendatei im Speicher oder zur Datenquelle und Verbindung. | Nein | Projekte, Kataloge, Bereiche |
Assetdetails | Informationen zur Größe der Daten, zur Anzahl der Spalten und Zeilen sowie zur Assetversion. | Nein | Projekte, Kataloge, Bereiche |
Teilfenster "Aktivitäten" | Das Protokoll der Aktionen, die für das Asset in allen Arbeitsbereichen ausgeführt wurden Siehe Aktivitäten. | Nein | Projekte, Kataloge |
Seite Asset voranzeigen oder Asset | Eine Vorschau der Daten, die eine begrenzte Gruppe von Spalten und Zeilen aus der ursprünglichen Datenquelle enthält Siehe Assetinhalt oder Vorschau. | Nein | Projekte, Kataloge, Bereiche |
Seite Profil | Metadaten und Statistiken zum Inhalt der Daten. Siehe Profil. | Ja | Projekte, Kataloge |
Seite Visualisierungen | Diagramme und Grafiken, die Benutzer erstellen, um die Daten zu verstehen. Siehe Visualisierungen. | Ja | Projekte |
Seite Featuregruppe | Informationen dazu, welche Spalten im Datenasset als Features in Modellen verwendet werden. Siehe Featuregruppen verwalten. | Ja | Projekte, Kataloge, Bereiche |
Eigenschaften von Verbindungsassets
Die Eigenschaften von Verbindungsassets hängen von der Datenquelle ab, die beim Erstellen einer Verbindung ausgewählt wurde. Siehe Verbindungstypen. Verbindungsassets für die meisten Datenquellen verfügen über die in der folgenden Tabelle aufgelisteten Eigenschaften.
Eigenschaften | Beschreibung | Bearbeitbar? | Arbeitsbereiche |
---|---|---|---|
Verbindungsdetails | Die Informationen, die die Datenquelle identifizieren. Zum Beispiel der Datenbankname, der Hostname, die IP-Adresse, der Port, die Instanz-ID, das Bucket, die Endpunkt-URL usw. | Ja | Projekte, Kataloge, Bereiche |
Berechtigungsnachweiseinstellung | Gibt an, ob die Berechtigungsnachweise plattformübergreifend gemeinsam genutzt werden (Standardeinstellung) oder ob jeder Benutzer seine persönlichen Berechtigungsnachweise eingeben muss. Nicht alle Datenquellen unterstützen persönliche Berechtigungsnachweise. | Ja | Projekte, Kataloge, Bereiche |
Authentifizierungsmethode | Das Format der Berechtigungsnachweisinformationen. Beispiel: ein API-Schlüssel oder ein Benutzername und ein Kennwort | Ja | Projekte, Kataloge, Bereiche |
Berechtigungsnachweise | Der Benutzername und das Kennwort, der API-Schlüssel oder andere Berechtigungsnachweise, die für die Datenquelle und die angegebene Authentifizierungsmethode erforderlich sind | Ja | Projekte, Kataloge, Bereiche |
Zertifikate | Gibt an, ob der Datenquellenport so konfiguriert ist, dass SSL-Verbindungen und andere Informationen zum SSL-Zertifikat akzeptiert werden. | Ja | Projekte, Kataloge, Bereiche |
Private Konnektivität | Die Methode zum Herstellen einer Verbindung zu einer Datenbank, die nicht in das Internet ausgelagert ist. Siehe Verbindungen sichern. | Ja | Projekte, Kataloge, Bereiche |
Position und Datenhoheit | Die physische Position des Rechenzentrums, in dem die Daten gespeichert sind, und die souveräne Entität, die für die Daten zuständig ist. | Ja | Projekte, Kataloge, Bereiche |
Weitere Informationen
- Der Wert von Assets
- Plattformweit nach Assets suchen
- Assetinhalt oder Vorschau
- Profile
- Aktivitäten
- Visualisierungen
- Einführung
- Verbindungstypen
Übergeordnetes Thema: Übersicht über IBM Cloud Pak for Data as a Service