Ein Assetprofil enthält generierte Informationen und Statistiken zum Assetinhalt. Das Profil wird auf der Seite Profil eines Assets angezeigt.
Anforderungen und Einschränkungen
Sie können das Profil von Assets unter den folgenden Umständen anzeigen:
Erforderliche Berechtigungen
Zum Anzeigen der Seite Profil eines Datenassets können Sie eine beliebige Rolle in einem Projekt haben.
Um ein Profil zu erstellen oder zu aktualisieren, müssen Sie über die Rolle Administrator oder Editor im Projekt verfügen.
Arbeitsbereiche
Sie können das Assetprofil in Projekten anzeigen.
Arten von Assets
Diese Assettypen verfügen über ein Profil:
Datenassets aus relationalen oder nicht relationalen Datenbanken aus einer Verbindung zu den Datenquellen mit Ausnahme von Cloudant
Datenassets aus partitionierten Dateien, wobei eine partitionierte Datei aus mehreren Dateien besteht und durch einen einzelnen Ordner dargestellt wird, der aus dem lokalen Dateisystem oder aus dateibasierten Verbindungen zu den Datenquellen hochgeladen wurde
Datenassets aus Dateien, die aus dem lokalen Dateisystem oder aus dateibasierten Verbindungen zu den Datenquellen hochgeladen wurden, in den folgenden Formaten:
- CSV
- XLS, XLSM, XLSX (Nur für das erste Arbeitsblatt in einer Arbeitsmappe wird ein Profil erstellt.
- Durch Tabulatoren getrennt (TSV)
- Avro
- Parquet
Dateien mit strukturierten Daten werden jedoch nicht mit einem Profil versehen, wenn Datenassets nicht explizit auf sie verweisen, wie z. B. in diesen Fällen:
- Die Dateien befinden sich in einem verbundenen Ordnerasset. Dateien, auf die von einem verbundenen Ordnerasset aus zugegriffen werden kann, werden nicht als Assets behandelt und es wird kein Profil erstellt.
- Die Dateien befinden sich in einer Archivdatei. Auf die Archivdatei wird von dem Datenasset verwiesen und die komprimierten Dateien werden nicht mit einem Profil versehen.
Erstellen eines Profils
In Projekten können Sie ein Profil für ein Datenasset erstellen, indem Sie auf Profil erstellenklicken. Sie können ein vorhandenes Profil aktualisieren, wenn sich die Daten ändern.
Ergebnisse der Profilerstellung
Wenn Sie ein Assetprofil erstellen oder aktualisieren, werden die Spalten im Datenasset analysiert. Standardmäßig wird das Profil auf der Basis der ersten 5.000 Datenzeilen erstellt. Wenn das Datenasset mehr als 250 Spalten enthält, werden die ersten 1.000 Datenzeilen für die Profilerstellung verwendet.
Das Profil eines Datenassets zeigt Informationen zu jeder Spalte im Dataset an.
- Gibt an, wann das Profil erstellt oder zuletzt aktualisiert wurde.
- Anzahl der analysierten Spalten und Zeilen.
- Die Datentypen für Spalten und Datentypverteilung.
- Die Datenformate für Spalten-und Formatverteilung.
- Der Prozentsatz der übereinstimmenden, nicht übereinstimmenden oder fehlenden Daten für jede Spalte.
- Die Häufigkeitsverteilung für alle in einer Spalte festgestellten Werte.
- Statistiken zu den Daten für jede Spalte:
- Die Anzahl unterschiedlicher Werte gibt an, wie viele verschiedene Werte in den Stichprobendaten für die Spalte vorhanden sind.
- Der Prozentsatz eindeutiger Werte gibt den Prozentsatz unterschiedlicher Werte an, die nur einmal in der Spalte angezeigt werden.
- Das Minimum, Maximum oder Mittel und manchmal die Standardabweichung in dieser Spalte. Abhängig vom Datenformat einer Spalte variieren die Statistikdaten geringfügig. Statistiken für eine Spalte des Datentyps 'integer' weisen beispielsweise Minimal-, Maximal-und Mittelwerte sowie einen Standardabweichungswert auf, während Statistiken für eine Spalte des Datentyps 'string' Werte für die Mindestlänge, maximale Länge und durchschnittliche Länge aufweisen.
Übergeordnetes Thema: Assettypen und Eigenschaften