Sie können ein Verbindungsasset für den Zugriff auf Ihre Daten in Google BigQuery erstellen.
Bei Google BigQuery handelt es sich um ein vollständig verwaltetes, serverloses Data-Warehouse, das eine skalierbare Analyse über Petabyte an Daten ermöglicht.
Verbindung zu Google BigQuery erstellen
Wählen Sie zum Erstellen des Verbindungsassets eine Authentifizierungsmethode aus. Zu den Auswahlmöglichkeiten gehören eine Authentifizierung mit oder ohne Workload-Identitätsföderation.
Ohne Einbindung der Workload-ID
- Kontoschlüssel (vollständiges JSON-Snippet): Der Inhalt der JSON-Datei des Google -Servicekontoschlüssels.
- Client-ID, geheimer Clientschlüssel, Zugriffstoken und Aktualisierungstoken.
Mit Workload-Identitätsföderation
Sie verwenden einen externen Identitätsprovider (IdP) für die Authentifizierung. Ein externer Identitätsprovider verwendet Identity and Access Management (IAM) anstelle von Servicekontoschlüsseln. IAM bietet mehr Sicherheit und zentralisiertes Management. Sie können die Workload-Identitätsföderationsauthentifizierung mit einem Zugriffstoken oder mit einer Token-URL verwenden.
Sie können eine Google BigQuery für den Workload-Identitätsverbund mit einem beliebigen Identitätsanbieter konfigurieren, der die OpenID Connect (OIDC)-Spezifikation erfüllt und die Google Cloud einhält, die in Bereiten Sie Ihren externen IdP vor beschrieben sind. Zu den Anforderungen gehören:
- Der Identitätsprovider muss OpenID Connect 1.0unterstützen.
- Die OIDC-Metadaten und JWKS-Endpunkte des Identitätsproviders müssen über das Internet öffentlich zugänglich sein. Google Cloud verwendet diese Endpunkte zum Download des Schlüsselsatzes Ihres Identitätsproviders und verwendet diesen Schlüsselsatz zum Validieren von Tokens.
- Der Identitätsprovider ist so konfiguriert, dass Ihre Workload ID-Tokens abrufen kann, die die folgenden Kriterien erfüllen:
- Tokens werden mit dem Algorithmus RS256 oder ES256 signiert.
- Tokens enthalten einen aud-Anspruch.
Beispiele für die Konfigurationsschritte des Workload-Identitätsverbunds für Amazon Web ServicesAWS) und Microsoft Azure finden Sie unter .
Workload Identity Federation mit Zugriffstokenverbindungsdetails
Zugriffstoken: Ein Zugriffstoken vom Identitätsprovider für die Verbindung zu BigQuery.
Zielgruppe des Sicherheitstokenservice: Die Zielgruppe des Sicherheitstokenservice, die die Projekt-ID, die Pool-ID und die Provider-ID enthält Verwenden Sie das folgende Format:
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
Weitere Informationen finden Sie unter Authentifizieren eines Workloads mithilfe der REST-API.
Service account email: Die E-Mail-Adresse des Google -Servicekontos, dessen Identität angenommen werden soll. Weitere Informationen finden Sie unter Erstellen eines Dienstkontos für den externen Workload.
Lebensdauer des Servicekontotokens (optional): Die Lebensdauer des Servicekontozugriffstokens in Sekunden. Die Standardlebensdauer eines Servicekontozugriffstokens beträgt eine Stunde. Weitere Informationen finden Sie unter URL-vermittelte Anmeldeinformationen.
Tokenformat: Text oder JSON mit dem Tokenfeldnamen für den Namen des Felds in der JSON-Antwort, das das Token enthält
Tokenfeldname: Der Name des Felds in der JSON-Antwort, das das Token enthält Dieses Feld wird nur angezeigt, wenn das Tokenformat JSON ist.
Tokentyp: AWS Signature Version 4-Anforderung, Google OAuth 2.0 -Zugriffstoken, ID-Token, JSON Web Token (JWT) oder SAML 2.0.
Workload Identity Federation mit Token-URL-Verbindungsdetails
Zielgruppe des Sicherheitstokenservice: Die Zielgruppe des Sicherheitstokenservice, die die Projekt-ID, die Pool-ID und die Provider-ID enthält Verwenden Sie das folgende Format:
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
Weitere Informationen finden Sie unter Authentifizieren eines Workloads mit der REST-API.
Service account email: Die E-Mail-Adresse des Google -Servicekontos, dessen Identität angenommen werden soll. Weitere Informationen finden Sie unter Erstellen eines Dienstkontos für den externen Workload.
Lebensdauer des Servicekontotokens (optional): Die Lebensdauer des Servicekontozugriffstokens in Sekunden. Die Standardlebensdauer eines Servicekontozugriffstokens beträgt eine Stunde. Weitere Informationen finden Sie unter URL-vermittelte Anmeldeinformationen.
Token-URL: Die URL zum Abrufen eines Tokens.
HTTP-Methode: Die für die Token-URL-Anforderung zu verwendende HTTP-Methode: GET, POST oder PUT.
Anforderungshauptteil (für POST-oder PUT-Methoden): Der Hauptteil der HTTP-Anforderung zum Abrufen eines Tokens.
HTTP-Header: HTTP-Header für die Token-URL-Anforderung in JSON oder als JSON-Hauptteil. Verwenden Sie das Format:
"Key1"="Value1","Key2"="Value2"
.Tokenformat: Text oder JSON mit dem Tokenfeldnamen für den Namen des Felds in der JSON-Antwort, das das Token enthält
Tokenfeldname: Der Name des Felds in der JSON-Antwort, das das Token enthält Dieses Feld wird nur angezeigt, wenn das Tokenformat JSON ist.
Tokentyp: AWS Signature Version 4-Anforderung, Google OAuth 2.0 -Zugriffstoken, ID-Token, JSON Web Token (JWT) oder SAML 2.0.
Server-Proxy (optional)
Wählen Sie Server-Proxy aus, um über einen HTTPS-Proxy-Server auf die Datenquelle Google BigQuery zuzugreifen. Je nach Konfiguration kann ein Proxy-Server Lastausgleich, erhöhte Sicherheit und Datenschutz bereitstellen. Die Proxy-Server-Einstellungen sind unabhängig von den Authentifizierungsnachweisen und der Auswahl persönlicher oder gemeinsam genutzter Berechtigungsnachweise.
- Proxy-Host: Der Hostname oder die IP-Adresse des HTTPS-Proxy-Servers Beispiel:
proxy.example.com
oder192.0.2.0
. - Proxy-Port: Die Portnummer für die Verbindung zum HTTPS-Proxy-Server. Beispiel:
8080
oder8443
. - Proxy username und Proxy password.
Andere Eigenschaften
Projekt-ID (optional) Die ID des Google -Projekts.
JSON-Ausgabezeichenfolgeformat: JSON-Zeichenfolgeformat für Ausgabewerte, die komplexe Datentypen sind (z. B. verschachtelt oder wiederholt).
- Pretty: Werte werden formatiert, bevor sie an die Ausgabe gesendet werden. Verwenden Sie diese Option, um einige Zeilen visuell zu lesen.
- Raw:(Standard) Keine Formatierung. Verwenden Sie diese Option für die beste Leistung.
Metadatenerkennung: Die Einstellung bestimmt, ob Kommentare zu Spalten (Anmerkungen) und Aliasnamen für Schemaobjekte wie Tabellen oder Ansichten (Synonyme) abgerufen werden, wenn Assets über diese Verbindung hinzugefügt werden.
Berechtigungen
Für die Verbindung zu Google BigQuery sind die folgenden BigQuery-Berechtigungen erforderlich:
bigquery.job.create
bigquery.tables.get
bigquery.tables.getData
Es gibt drei Möglichkeiten, diese Berechtigungen zu erhalten:
- Verwenden Sie die vordefinierte BigQuery Cloud-IAM-Rolle
bigquery.admin
, die diese Berechtigungen enthält. - Verwenden Sie eine Kombination aus zwei Rollen (eine aus jeder Spalte in der folgenden Tabelle) oder
- Erstellen Sie eine angepasste Rolle. Siehe Benutzerdefinierte Rollen erstellen und verwalten.
Erste Rolle | Zweite Rolle |
---|---|
bigquery.dataEditor |
bigquery.jobUser |
bigquery.dataOwner |
bigquery.user |
bigquery.dataViewer |
Weitere Informationen zu Berechtigungen und Rollen in Google BigQuery finden Sie unter Vordefinierte Rollen und Berechtigungen.
Je nach Position auf der Plattform geeignete Methode zum Erstellen einer Verbindung auswählen
- In einem Projekt
- Klicken Sie auf Assets > Neues Asset > Verbindung zu einer Datenquelle herstellen. Weitere Informationen finden Sie unter Verbindung zu einem Projekt hinzufügen.
- In einem Bereitstellungsbereich
- Klicken Sie auf Assets importieren > Datenzugriff > Verbindung. Siehe Datenassets zu einem Bereitstellungsbereich hinzufügen.
- Im Katalog der Plattformressourcen
- Klicken Sie auf Neue Verbindung. Weitere Informationen finden Sie unter Hinzufügen von Plattformverbindungen.
Nächster Schritt: Fügen Sie Datenassets aus der Verbindung hinzu
- Weitere Informationen finden Sie unter Daten aus einer Verbindung in einem Projekt hinzufügen.
Wo Sie diese Verbindung verwenden können
Sie können Google BigQuery-Verbindungen in den folgenden Arbeitsbereichen und Tools verwenden:
Projekte
- Data Refinery
- SPSS Modeler
- Synthetic Data Generator
Kataloge
- Platform assets catalog
Google BigQuery-Konfiguration
Weitere Informationen
Übergeordnetes Thema: Unterstützte Verbindungen