Connexion Google BigQuery | IBM Cloud Pak for Data as a Service

Retourner à la version anglaise de la documentation

Connexion Google BigQuery

Dernière mise à jour : 28 nov. 2024

Connexion Google BigQuery

Pour accéder à vos données dans Google BigQuery, créez un actif de connexion pour celui-ci.

Google BigQuery est un entrepôt de données entièrement géré et sans serveur qui permet une analyse évolutive sur des pétaoctets de données.

Créer une connexion à Google BigQuery

Pour créer l'actif de connexion, choisissez une méthode d'authentification. Les options incluent une authentification avec ou sans fédération d'identité de charge de travail.

Sans fédération d'identité de charge de travail

Clé de compte (fragment JSON complet): contenu du fichier JSON de clé de compte de service Google
ID client, secret client, jeton d'accès et jeton de régénération

Avec la fédération d'identité de charge de travail
Vous utilisez un fournisseur d'identité externe (IdP) pour l'authentification. Un fournisseur d'identité externe utilise IAM (Identity and Access Management) à la place des clés de compte de service. IAM offre une sécurité accrue et une gestion centralisée. Vous pouvez utiliser l'authentification par fédération d'identité de charge de travail avec un jeton d'accès ou avec une URL de jeton.

Vous pouvez configurer une connexion Google BigQuery pour la fédération d'identité de charge de travail avec n'importe quel fournisseur d'identité conforme à la spécification OpenID Connect (OIDC) et répondant aux exigences de Google Cloud décrites dans la section Préparer votre IdP externe. Les exigences sont les suivantes:

Le fournisseur d'identité doit prendre en charge OpenID Connect 1.0.
Les métadonnées OIDC et les noeuds finaux JWKS du fournisseur d'identité doivent être accessibles au public sur Internet. Google Cloud utilise ces noeuds finaux pour télécharger l'ensemble de clés de votre fournisseur d'identité et utilise cet ensemble de clés pour valider les jetons.
Le fournisseur d'identité est configuré de sorte que votre charge de travail puisse obtenir des jetons d'ID qui répondent aux critères suivants:
- Les jetons sont signés avec l'algorithme RS256 ou ES256 .
- Les jetons contiennent une réclamation aud.

Pour des exemples d'étapes de configuration de la fédération d'identité de la charge de travail pour Amazon Web ServicesAWS et Microsoft Azure, voir .

Fédération d'identité de charge de travail avec détails de connexion de jeton d'accès

Jeton d'accès: jeton d'accès du fournisseur d'identité permettant de se connecter à BigQuery.
Public du service de jeton de sécurité: Public du service de jeton de sécurité qui contient l'ID de projet, l'ID de pool et l'ID de fournisseur. Utilisez le format suivant :
```
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
```
Pour plus d'informations, voir Authentifier une charge de travail à l'aide de l'API REST.
Adresse électronique du compte de service: adresse électronique du compte de service Google dont l'identité doit être usurpée. Pour plus d'informations, voir Créer un compte de service pour la charge de travail externe.
Durée de vie du jeton de compte de service (facultatif): durée de vie en secondes du jeton d'accès du compte de service. La durée de vie par défaut d'un jeton d'accès de compte de service est d'une heure. Pour plus d'informations, voir les informations d'identification provenant d'une URL.
Format de jeton: texte ou JSON avec le nom de zone de jeton pour le nom de la zone dans la réponse JSON qui contient le jeton.
Token field name: nom de la zone dans la réponse JSON qui contient le jeton. Cette zone s'affiche uniquement lorsque le Format de jeton est JSON.
Type de jeton: demande AWS Signature Version 4, jeton d'accès Google OAuth 2.0 , jeton d'ID, jeton Web JSON (JWT) ou SAML 2.0.

Fédération d'identité de charge de travail avec détails de connexion d'URL de jeton

Public du service de jeton de sécurité: Public du service de jeton de sécurité qui contient l'ID de projet, l'ID de pool et l'ID de fournisseur. Utilisez le format suivant :
```
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
```
Pour plus d'informations, voir Authentifier une charge de travail à l'aide de l'API REST.
Adresse électronique du compte de service: adresse électronique du compte de service Google dont l'identité doit être usurpée. Pour plus d'informations, voir Créer un compte de service pour la charge de travail externe.
Durée de vie du jeton de compte de service (facultatif): durée de vie en secondes du jeton d'accès du compte de service. La durée de vie par défaut d'un jeton d'accès de compte de service est d'une heure. Pour plus d'informations, voir les informations d'identification provenant d'une URL.
URL de jeton: URL permettant d'extraire un jeton.
Méthode HTTP: méthode HTTP à utiliser pour la demande d'URL de jeton: GET, POST ou PUT.
Corps de la demande (pour les méthodes POST ou PUT): corps de la demande HTTP pour extraire un jeton.
En-têtes HTTP: en-têtes HTTP pour la demande d'URL de jeton en JSON ou en tant que corps JSON. Utilisez le format: "Key1"="Value1","Key2"="Value2".
Format de jeton: texte ou JSON avec le nom de zone de jeton pour le nom de la zone dans la réponse JSON qui contient le jeton.
Token field name: nom de la zone dans la réponse JSON qui contient le jeton. Cette zone s'affiche uniquement lorsque le Format de jeton est JSON.
Type de jeton: demande AWS Signature Version 4, jeton d'accès Google OAuth 2.0 , jeton d'ID, jeton Web JSON (JWT) ou SAML 2.0.

Proxy serveur (facultatif)

Sélectionnez Serveur proxy pour accéder à la source de données Google BigQuery via un serveur proxy HTTPS. En fonction de sa configuration, un serveur proxy peut fournir un équilibrage de charge, une sécurité et une confidentialité accrues. Les paramètres du serveur proxy sont indépendants des données d'authentification et de la sélection des données d'identification personnelles ou partagées.

Hôte proxy: nom d'hôte ou adresse IP du serveur proxy HTTPS. Par exemple, proxy.example.com ou 192.0.2.0.
Port du proxy: numéro de port permettant de se connecter au serveur proxy HTTPS. Par exemple, 8080 ou 8443.
Nom d'utilisateur du proxy et Mot de passe du proxy.

Autres propriétés

ID projet (facultatif) ID du projet Google .

Format de chaîne JSON de sortie: format de chaîne JSON pour les valeurs de sortie qui sont des types de données complexes (par exemple, imbriquées ou répétées).

Jolie: les valeurs sont formatées avant d'être envoyées en sortie. Utilisez cette option pour lire visuellement quelques lignes.
Brut: (valeur par défaut) Pas de formatage. Utilisez cette option pour obtenir les meilleures performances.

Reconnaissance des métadonnées: ce paramètre détermine si les commentaires sur les colonnes (remarques) et les alias des objets de schéma tels que les tables ou les vues (synonymes) sont extraits lorsque des actifs sont ajoutés à l'aide de cette connexion.

Droits

La connexion à Google BigQuery requiert les droits BigQuery suivants :

bigquery.job.create
bigquery.tables.get
bigquery.tables.getData

Utilisez l'une des trois méthodes suivantes pour obtenir ces droits :

Utilisez le rôle prédéfini BigQuery Cloud IAM bigquery.admin, qui inclut ces droits d'accès.
Utilisez une combinaison de deux rôles, l'un de chaque colonne du tableau suivant ; ou
Créer un rôle personnalisé. Voir Créer et gérer des rôles personnalisés.

Premier rôle	Deuxième rôle
`bigquery.dataEditor`	`bigquery.jobUser`
`bigquery.dataOwner`	`bigquery.user`
`bigquery.dataViewer`

Pour plus d'informations sur les autorisations et les rôles dans Google BigQuery, voir Rôles et autorisations prédéfinis.

Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.

Dans un projet: Cliquez sur Actifs > Nouvel actif > Connexion à une source de données. Voir Ajout d'une connexion à un projet.
Dans un catalogue: Cliquez sur Ajouter au catalogue > Connexion. Voir Ajout d'un actif de connexion à un catalogue.
Dans un espace de déploiement: Cliquez sur Importer les actifs > Accès aux données > Connexion. Voir Ajout d'actifs de données à un espace de déploiement.
Dans le catalogue d'actifs de la plateforme: Cliquez sur Nouvelle connexion. Voir Ajout de connexions de plateforme.

Etape suivante : ajout d'actifs de données à partir de la connexion

Où vous pouvez utiliser cette connexion

Vous pouvez utiliser les connexions Google BigQuery dans les espaces de travail et les outils suivants :

Projets

Règles de qualité des données (IBM Knowledge Catalog)
Data Refinerywatsonx.ai Studio ou IBM Knowledge Catalog)
DataStage (serviceDataStage ). Voir Connexion à une source de données dans DataStage.
Enrichissement de métadonnées (IBM Knowledge Catalog)
Metadata import (IBM Knowledge Catalog)
service SPSS Modeler " (watsonx.ai Studio)

Catalogs

Platform assets catalog
Autres catalogues (IBM Knowledge Catalog)

Service deData Virtualization: Vous pouvez vous connecter à cette source de données depuis Data Virtualization. Cette connexion nécessite une attention particulière dans le cadre de la Data Virtualization. Voir Connexion à Google BigQuery dans Data Virtualization.

Configuration de Google BigQuery

Démarrage rapide à l'aide de la console de cloud

En savoir plus

Documentation de Google BigQuery

Rubrique parent : Connexions prises en charge