Google BigQuery konfiguration der Abstammung
Um Metadaten aus Google BigQuery zu importieren, erstellen Sie eine Verbindung, eine Datenquellendefinition und einen Metadaten-Importauftrag.
Führen Sie die folgenden Schritte aus, um Metadaten zur Abstammung für Google BigQuery zu importieren:
- Erstellen Sie eine Datenquellendefinition.
- Erstellen Sie eine Verbindung zur Datenquelle in einem Projekt.
- Erstellen Sie einen Metadatenimport.
Erstellen einer Datenquellendefinition
Erstellen Sie eine Datenquellendefinition. Wählen Sie Google BigQuery als Datenquellentyp.
Erstellen einer Verbindung zu Google BigQuery
Erstellen Sie eine Verbindung zur Datenquelle in einem Projekt. Einzelheiten zu den Verbindungen finden Sie unter Google BigQuery connection.
Erstellen eines Metadatenimports
Erstellen Sie einen Metadatenimport. Erfahren Sie mehr über die Optionen, die für die Datenquelle Google BigQuery spezifisch sind:
Einschluss- und Ausschlusslisten
Sie können Assets bis zur Datensatzebene ein- oder ausschließen. Stellen Sie Projekte und Datensätze im Format "Projekt/Datensatz" bereit. Jeder Teil wird als regulärer Ausdruck ausgewertet. Assets, die der Datenquelle später hinzugefügt werden, werden ebenfalls eingeschlossen oder ausgeschlossen, wenn sie den in den Listen angegebenen Bedingungen entsprechen. Beispielwerte:
myProject/
: alle Datensätze inmyProject
,myProject2/.*
: alle Datensätze inmyProject2
,myProject3/myDataset1
:myDataset1
vonmyProject3
,myProject4/myDataset[1-5]
: jeder Datensatz in meinemmyProject4
mit einem Namen, der mitmyDataset
beginnt und mit einer Ziffer zwischen 1 und 5 endet
Externe Eingaben
Wenn Sie externe Google BigQuery SQL- oder Jobskripte verwenden, können Sie diese in einer.zip-Datei als externe Eingabe hinzufügen. Sie können die Struktur einer ZIP-Datei in Unterordnern organisieren, die Projekte und Datasets darstellen. Nach dem Scannen der Scripts werden sie den jeweiligen Projekten und Datasets im ausgewählten Katalog oder Projekt hinzugefügt. Die.zip-Datei kann die folgende Struktur haben:
<project_id>
<dataset_name>
<script_name.sql>
<project_id>
<script_name.sql>
jobs
<job_name.json>
<script_name.sql>
replace.csv
connectionsConfiguration.prm
Die Datei replace.csv
enthält Platzhalter für die Skripte, die in der.zip-Datei hinzugefügt werden. Weitere Informationen über das Format finden Sie unter Ersetzung von Platzhaltern.
Die Datei connectionsConfiguration.prm
enthält Definitionen von Datenbankverbindungsressourcen, die in Verbundabfragen verwendet werden. Die Datei kann wie folgt aufgebaut sein:
[{Shortcut_Name}] Type={connection_type}
Connection_String={connection_string}
Server_Name={server_name}
Database_Name={database_name}
Schema_Name={schema_name}
User_Name={user_name}
Weitere Informationen
Übergeordnetes Thema: Unterstützte Konnektoren für den Import von Abstammungslinien