Führen Sie eine Primärschlüsselanalyse aus, um einzelne oder zusammengesetzte Primärschlüssel in den Datenassets in einer relationalen Datenbank zu identifizieren. Ein Primärschlüssel identifiziert jeden Datensatz in einem Datenasset eindeutig. Jedes Datenasset kann nur einen Primärschlüssel haben.
Überprüfen Sie die Primärschlüssel, die bereits in Ihren Daten definiert sind, und identifizieren Sie Spalten, die Kandidaten für Primärschlüssel sind. Ein Primärschlüssel muss eindeutig sein und darf keine Nullwerte enthalten.
Dieser Analysetyp identifiziert einspaltige Primärschlüssel für ein Datenasset, indem eine Spalte gesucht wird, die als eindeutige Kennung für Ihre Daten qualifiziert ist. Um einen mehrspaltigen oder zusammengesetzten Primärschlüssel zu identifizieren, ermittelt die Analyse, welche Kombinationen von Spalten eindeutige Werte enthalten, sodass sie Kandidaten für Primärschlüssel sind. Die Werte für verschiedene Spaltenkombinationen werden ausgewertet und die Eindeutigkeit der verknüpften Werte berechnet. Nur benachbarte Spalten werden überprüft.
Nur Spalten und Kombinationen von Spalten mit einer Konfidenz, die den definierten Schwellenwert überschreitet (entweder in den Aufbereitungseinstellungen oder für eine einzelne Ausführung) werden als Primärschlüssel vorgeschlagen. Wenn bereits ein Primärschlüssel in Ihren Daten definiert ist, wird er automatisch zugeordnet. Diese Informationen müssen explizit in einen Metadatenimport eingeschlossen werden. Sie können die Ergebnisse einer Primärschlüsselanalyse weiterhin verwenden, um definierte Primärschlüssel zu validieren.
- Voraussetzungen
- Primärschlüssel manuell festlegen
- Primärschlüsselanalyse ausführen
- Analyseergebnisse überprüfen und Schlüssel zuordnen
- Tastenzuordnung aufheben oder entfernen
- Auf Jobausführungsdetails zugreifen
Voraussetzungen
Der DataStage -Service muss für die Ausführung der Primärschlüsselanalyse implementiert werden.
Alle Operationen, die im Rahmen einer Metadatenanreicherung ausgeführt werden, erfordern Berechtigungsnachweise für eine sichere Autorisierung. Normalerweise wird Ihr Benutzer-API-Schlüssel verwendet, um solche Operationen mit langer Laufzeit ohne Unterbrechung auszuführen. Wenn keine Berechtigungsnachweise verfügbar sind, wenn Sie versuchen, eine Primärschlüsselanalyse auszuführen, werden Sie aufgefordert, einen API-Schlüssel zu erstellen. Dieser API-Schlüssel wird dann als Ihre Taskberechtigungsnachweise gespeichert. Siehe Benutzer-API-Schlüssel verwalten.
Wenn Verbindungen zu den Datenquellen gesperrt sind, werden Sie aufgefordert, Ihre persönlichen Berechtigungsnachweise einzugeben. Dies ist ein einmaliger Schritt, der die Verbindungen permanent für Sie entsperrt.
Sie können die Primärschlüsselanalyse ausführen, ohne zuerst Assetprofile zu erstellen. Die Analyse stützt sich nicht auf Profilinformationen wie die Häufigkeitsverteilung von Spaltenwerten. Stattdessen werden Spaltendaten direkt analysiert.
Primärschlüssel manuell festlegen
Wenn Ihre Daten bereits mit der Option Profildaten analysiert wurden, können Sie einen Primärschlüssel festlegen, ohne eine Schlüssel-oder Beziehungsanalyse auszuführen, oder Sie können eine Zuordnung ändern. Öffnen Sie die Spaltenansicht eines Assets durch Klicken auf den Assetnamen oder durch Auswählen von Spalten anzeigen im Überlaufmenü.
- Um einen einspaltigen Primärschlüssel festzulegen, wählen Sie eine Spalte aus und wählen Sie in der Symbolleiste Mehr > Als Primärschlüssel zuordnen aus.
- Um einen mehrspaltigen Primärschlüssel festzulegen, wählen Sie die Spalten aus, aus denen Sie den Schlüssel bilden möchten, und wählen Sie in der Symbolleiste Mehr > Als zusammengesetzten Primärschlüssel zuordnen aus.
Wenn Sie einen Primärschlüssel ersetzen, werden alle Beziehungen für den alten Primärschlüssel nicht zugeordnet. Sie müssen neue Beziehungen festlegen.
Primärschlüsselanalyse ausführen
Gehen Sie wie folgt vor, um eine Primärschlüsselanalyse für ein oder mehrere Assets auszuführen:
Öffnen Sie das Metadatenaufbereitungsasset.
Wählen Sie auf der Registerkarte Assets die gewünschten Assets aus.
Wählen Sie in der Symbolleiste Aufbereiten > Primärschlüssel identifizieren aus.
Diese Analyse wird standardmäßig für eine einzelne Spalte ausgeführt. Eine einzelne Spalte erfüllt jedoch möglicherweise nicht die Kriterien für einen Primärschlüssel. In diesem Fall können Sie auswählen, die Analyse für mehrere Spalten auszuführen, um einen zusammengesetzten Primärschlüssel zu erstellen. Die Analyse verkettet die Werte für verschiedene Spaltenkombinationen, berechnet die Eindeutigkeit der verketteten Werte und bestimmt so, welche Kombinationen von Spalten eindeutige Werte enthalten, wodurch sie Primärschlüsselkandidaten werden. Eine solche Analyse kann je nach Größe eines Datenassets sehr zeitaufwendig sein.
Klicken Sie auf Run. Sie werden benachrichtigt, wenn die Analyse abgeschlossen ist, aber Sie müssen möglicherweise die Aufbereitungsergebnisse aktualisieren, um alle neuen Primärschlüssel anzuzeigen.
Standardmäßig haben alle Primärschlüssel, die während der Analyse identifiziert werden, einen Kandidatenstatus, was bedeutet, dass sie als vorgeschlagene Schlüssel angezeigt werden, sofern Ihre Daten bereits definierte Primärschlüssel enthalten. In diesem Fall werden diese Spalten während der Analyse als Primärschlüssel zugeordnet.
Durch das Ausführen einer weiteren Primärschlüsselanalyse werden alle zuvor vorgeschlagenen Primärschlüssel gelöscht, die während der aktuellen Analyse nicht gefunden wurden. Beispiel: Die Ausführung einer einspaltigen Primärschlüsselanalyse entfernt alle zusammengesetzten Primärschlüsselkandidaten, die in einer vorherigen Analyse identifiziert wurden.
Analyseergebnisse überprüfen und Schlüssel zuordnen
Überprüfen Sie die Schlüssel für ein Asset auf der Registerkarte Schlüssel in der Detailanzeige des Assets. Wenn Ihre Daten bereits einen Primärschlüssel enthalten, werden sie hier als zugeordnet angezeigt. Außerdem werden hier alle vorgeschlagenen Schlüssel aufgelistet. Um den zugewiesenen Primärschlüssel zu ändern, klicken Sie auf das Symbol Bearbeiten .
Die vollständige Liste der Schlüssel enthält die folgenden Informationen:
- Der Name einer Spalte, die als Primärschlüssel vorgeschlagen oder zugeordnet wird, oder eine Liste von Spaltennamen für einen zusammengesetzten Primärschlüssel
- Die Anzahl der Spalten, aus denen der zugeordnete Primärschlüssel oder der Kandidatenprimärschlüssel besteht.
- Der Datentyp der Spalte (n), aus denen der zugeordnete Primärschlüssel oder der Kandidatenprimärschlüssel besteht.
- Der Verlässlichkeitsscore für das Zuweisen oder Vorschlagen eines Schlüssels.
- Anzahl und Prozentsatz unterschiedlicher, eindeutiger und Nullwerte für jeden Schlüssel
- Der Status des Schlüssels, der Zugeordnet oder Vorgeschlagen sein kann.
- Das Datum, an dem die Spalte zuletzt geändert wurde.
Wählen Sie Zuweisen im Überlaufmenü des Schlüssels aus, um einen Primärschlüssel zuzuordnen oder den zugeordneten Schlüssel zu ersetzen. Wenn Sie den vorhandenen Primärschlüssel ersetzen, werden alle Beziehungen für den alten Primärschlüssel nicht zugeordnet. Anschließend können Sie neue Beziehungen definieren.
Tastenbelegung aufheben oder Schlüssel entfernen
Sie können die Zuordnung eines Schlüssels aufheben. In diesem Fall werden alle Beziehungen für diesen Primärschlüssel ebenfalls nicht zugeordnet und der Status des Schlüssels wird auf 'vorgeschlagen' gesetzt. Anschließend können Sie einen neuen Primärschlüssel zuordnen und entsprechende Beziehungen definieren.
Sie können auch einen zugewiesenen oder vorgeschlagenen Schlüssel vollständig entfernen. Alle Beziehungen für diesen Schlüssel werden nicht zugeordnet. Ein entfernter Schlüssel kann vorgeschlagen oder erneut zugeordnet werden, wenn Sie die Primärschlüsselanalyse erneut ausführen.
Auf Jobausführungsdetails zugreifen
Während Sie über die Seitenanzeige auf die Jobdetails für die allgemeine Metadatenaufbereitung zugreifen können, müssen Sie die Registerkarte Jobs des Projekts aufrufen, um die Jobs für die Primärschlüsselanalyse anzuzeigen. Der Job hat den Typ Schlüsselanalyse für Metadatenanreicherungsassets. Der Jobname entspricht dem Muster metadata_enrichment_name (PK Detection).
Weitere Informationen
Übergeordnetes Thema: Datenassets aufbereiten