Sie können ein Verbindungsasset für den Zugriff auf Ihre Daten in Google Cloud Storage erstellen.
Google Cloud Storage ist ein Web-Service für Onlinedateispeicher zum Speichern und Zugreifen auf Daten in der Google Cloud Platform-Infrastruktur.
Verbindung zu Google Cloud Storage erstellen
Wählen Sie zum Erstellen des Verbindungsassets eine Authentifizierungsmethode aus. Zu den Auswahlmöglichkeiten gehören eine Authentifizierung mit oder ohne Workload-Identitätsföderation.
Ohne Einbindung der Workload-ID
- Kontoschlüssel (vollständiges JSON-Snippet): Der Inhalt der JSON-Datei des Google -Servicekontoschlüssels.
- Client-ID, geheimer Clientschlüssel, Zugriffstoken und Aktualisierungstoken.
Mit Workload-Identitätsföderation
Sie verwenden einen externen Identitätsprovider (IdP) für die Authentifizierung. Ein externer Identitätsprovider verwendet Identity and Access Management (IAM) anstelle von Servicekontoschlüsseln. IAM bietet mehr Sicherheit und zentralisiertes Management. Sie können die Workload-Identity-Federation-Authentifizierung mit einem Zugriffstoken oder mit einem Token URL verwenden.
Sie können eine Google BigQuery für den Workload-Identitätsverbund mit einem beliebigen Identitätsanbieter konfigurieren, der die OpenID Connect (OIDC)-Spezifikation erfüllt und die Google Cloud einhält, die in Bereiten Sie Ihren externen IdP vor beschrieben sind. Zu den Anforderungen gehören:
- Der Identitätsprovider muss OpenID Connect 1.0unterstützen.
- Die OIDC-Metadaten und JWKS-Endpunkte des Identitätsproviders müssen über das Internet öffentlich zugänglich sein. Google Cloud verwendet diese Endpunkte zum Download des Schlüsselsatzes Ihres Identitätsproviders und verwendet diesen Schlüsselsatz zum Validieren von Tokens.
- Der Identitätsprovider ist so konfiguriert, dass Ihre Workload ID-Tokens abrufen kann, die die folgenden Kriterien erfüllen:
- Tokens werden mit dem Algorithmus RS256 oder ES256 signiert.
- Tokens enthalten einen aud-Anspruch.
Beispiele für die Konfigurationsschritte des Workload-Identitätsverbunds für Amazon Web ServicesAWS) und Microsoft Azure finden Sie unter .
Workload Identity Federation mit Zugriffstokenverbindungsdetails
Zugriffstoken: Ein Zugriffstoken vom Identitätsprovider für die Verbindung zu BigQuery.
Zielgruppe des Sicherheitstokenservice: Die Zielgruppe des Sicherheitstokenservice, die die Projekt-ID, die Pool-ID und die Provider-ID enthält Verwenden Sie das folgende Format:
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
Weitere Informationen finden Sie unter Authentifizieren eines Workloads mithilfe der REST-API.
Service account email: Die E-Mail-Adresse des Google -Servicekontos, dessen Identität angenommen werden soll. Weitere Informationen finden Sie unter Erstellen eines Dienstkontos für den externen Workload.
Lebensdauer des Servicekontotokens (optional): Die Lebensdauer des Servicekontozugriffstokens in Sekunden. Die Standardlebensdauer eines Servicekontozugriffstokens beträgt eine Stunde. Weitere Informationen finden Sie unter URL -sourced credentials.
Tokenformat: Text oder JSON mit dem Tokenfeldnamen für den Namen des Felds in der JSON-Antwort, die das Token enthält
Tokenfeldname: Der Name des Felds in der JSON-Antwort, das das Token enthält. Dieses Feld wird nur angezeigt, wenn das Tokenformat JSON ist.
Tokentyp: AWS Signature Version 4-Anforderung, Google OAuth 2.0 -Zugriffstoken, ID-Token, JSON Web Token (JWT) oder SAML 2.0.
Workload Identity Federation mit Token URL Verbindungsdetails
Zielgruppe des Sicherheitstokenservice: Die Zielgruppe des Sicherheitstokenservice, die die Projekt-ID, die Pool-ID und die Provider-ID enthält Verwenden Sie das folgende Format:
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
Weitere Informationen finden Sie unter Authentifizieren eines Workloads mit der REST-API.
Service account email: Die E-Mail-Adresse des Google -Servicekontos, dessen Identität angenommen werden soll. Weitere Informationen finden Sie unter Erstellen eines Dienstkontos für den externen Workload.
Lebensdauer des Servicekontotokens (optional): Die Lebensdauer des Servicekontozugriffstokens in Sekunden. Die Standardlebensdauer eines Servicekontozugriffstokens beträgt eine Stunde. Weitere Informationen finden Sie unter URL -sourced credentials.
Token URL : Die URL, um ein Token abzurufen.
HTTP methode : HTTP Methode, die für das Token URL verwendet werden soll: GET, POST oder PUT.
Anfragetext (für POST- oder PUT-Methoden): Der Text der HTTP -Anfrage zum Abrufen eines Tokens.
HTTP header : HTTP Header für das Token URL Anfrage in JSON oder als JSON-Textkörper. Verwenden Sie das Format:
"Key1"="Value1","Key2"="Value2"
.Tokenformat: Text oder JSON mit dem Tokenfeldnamen für den Namen des Felds in der JSON-Antwort, die das Token enthält
Tokenfeldname: Der Name des Felds in der JSON-Antwort, das das Token enthält. Dieses Feld wird nur angezeigt, wenn das Tokenformat JSON ist.
Tokentyp: AWS Signature Version 4-Anforderung, Google OAuth 2.0 -Zugriffstoken, ID-Token, JSON Web Token (JWT) oder SAML 2.0.
Server-Proxy (optional)
Wählen Sie "Server-Proxy ", um über einen HTTPS -Proxyserver auf die Datenquelle Google Cloud Storage zuzugreifen. Je nach Konfiguration kann ein Proxyserver für Lastausgleich, erhöhte Sicherheit und Datenschutz sorgen. Die Proxyserver-Einstellungen sind unabhängig von den Authentifizierungsdaten und der Auswahl persönlicher oder gemeinsam genutzter Daten. Für zusätzliche Sicherheit kann ein SSL-Zertifikat bereitgestellt werden.
- Proxy-Host : Der Hostname oder die IP-Adresse des HTTPS -Proxyservers. Beispiel:
proxy.example.com
oder192.0.2.0
. - Proxy-Port : Die Portnummer für die Verbindung mit dem HTTPS -Proxyserver. Beispiel:
8080
oder8443
. - Proxy-Benutzername Und Proxy-Passwort.
Andere Eigenschaften
Projekt-ID (optional) Die ID des Google -Projekts.
Je nach Position auf der Plattform geeignete Methode zum Erstellen einer Verbindung auswählen
- In einem Projekt
- Klicken Sie auf Assets > Neues Asset > Verbindung zu einer Datenquelle herstellen. Weitere Informationen finden Sie unter Verbindung zu einem Projekt hinzufügen.
- In einem Katalog
- Klicken Sie auf Zu Katalog hinzufügen > Verbindung. Weitere Informationen finden Sie unter Verbindungsasset zu einem Katalog hinzufügen.
- In einem Bereitstellungsbereich
- Klicken Sie auf Assets importieren > Datenzugriff > Verbindung. Siehe Datenassets zu einem Bereitstellungsbereich hinzufügen.
- Im Katalog der Plattformressourcen
- Klicken Sie auf Neue Verbindung. Weitere Informationen finden Sie unter Hinzufügen von Plattformverbindungen.
Nächster Schritt: Fügen Sie Datenassets aus der Verbindung hinzu
Weitere Informationen finden Sie unter Daten aus einer Verbindung in einem Projekt hinzufügen.
Weitere Informationen finden Sie unter Daten aus einer Verbindung in einem Katalog hinzufügen.
Wo Sie diese Verbindung verwenden können
Sie können Google Cloud Storage-Verbindungen in den folgenden Arbeitsbereichen und Tools verwenden:
Projekte
- Regeln zur Datenqualität ( IBM Knowledge Catalog ). Siehe Unterstützte Datenquellen für Kuratierung und Datenqualität.
- Data Refinerywatsonx.ai Studio oder IBM Knowledge Catalog)
- DataStage (DataStage -Service) Siehe Verbindung zu einer Datenquelle in DataStage.
- Decision Optimizationwatsonx.ai Studio und watsonx.ai Runtime)
- Metadatenanreicherung ( IBM Knowledge Catalog ). Siehe Unterstützte Datenquellen für Kuratierung und Datenqualität.
- Metadata import (IBM Knowledge Catalog). Siehe Unterstützte Datenquellen für Kuratierung und Datenqualität.
- SPSS Modelerwatsonx.ai Studio)
Kataloge
Platform assets catalog
Andere Kataloge (IBM Knowledge Catalog )
Unterstützte Dateitypen
Die Google Cloud Storage-Verbindung unterstützt die folgenden Dateitypen: Avro, CSV, Text mit Trennzeichen, Excel, JSON, ORC, Parquet, SAS, SAV, SHP und XML.
Tabellenformate
Die Verbindung Google Cloud Storage unterstützt diese Data-Lake-Tabellenformate: Delta Lake und Iceberg.
Weitere Informationen
Übergeordnetes Thema: Unterstützte Verbindungen