0 / 0
Volver a la versión inglesa de la documentación
Conexión de Google BigQuery
Última actualización: 28 nov 2024
Conexión de Google BigQuery

Para acceder a sus datos en Google BigQuery, cree un activo de conexión para el mismo.

Google BigQuery es un almacén de datos sin servidor completo que permite el análisis escalable sobre los petabytes de datos.

Crear una conexión con Google BigQuery

Para crear el activo de conexión, elija un método de autenticación. Las opciones incluyen una autenticación con o sin federación de identidad de carga de trabajo.

Sin federación de identidad de carga de trabajo

  • Clave de cuenta (fragmento de código JSON completo): el contenido del archivo JSON de clave de cuenta de servicio de Google
  • ID de cliente, secreto de cliente, señal de acceso y señal de renovación

Con federación de identidad de carga de trabajo
Utilice un proveedor de identidad externo (IdP) para la autenticación. Un proveedor de identidad externo utiliza Identity and Access Management (IAM) en lugar de claves de cuenta de servicio. IAM proporciona una mayor seguridad y una gestión centralizada. Puede utilizar la autenticación de federación de identidad de carga de trabajo con una señal de acceso o con un URL de señal.

Puede configurar una conexión de Google BigQuery para la federación de identidades de carga de trabajo con cualquier proveedor de identidades que cumpla con la especificación OpenID Connect (OIDC) y que satisfaga los requisitos de Google Cloud que se describen en Prepare su IdP externo. Los requisitos incluyen:

  • El proveedor de identidad debe dar soporte a OpenID Connect 1.0.
  • Los metadatos OIDC del proveedor de identidad y los puntos finales JWKS deben ser accesibles públicamente a través de Internet. Google Cloud utiliza estos puntos finales para descargar el conjunto de claves del proveedor de identidades y utiliza dicho conjunto de claves para validar señales.
  • El proveedor de identidad está configurado para que la carga de trabajo pueda obtener señales de ID que cumplan estos criterios:
    • Las señales se firman con el algoritmo RS256 o ES256 .
    • Las señales contienen una reclamación aud.

Para ver ejemplos de los pasos de configuración de la federación de identidades de la carga de trabajo para Amazon Web ServicesAWS) y Microsoft Azure, consulte .

Detalles de federación de identidades de carga de trabajo con conexión de señal de acceso

  • Señal de acceso: una señal de acceso del proveedor de identidades para conectarse a BigQuery.

  • Audiencia de servicio de señal de seguridad: la audiencia de servicio de señal de seguridad que contiene el ID de proyecto, el ID de agrupación y el ID de proveedor. Utilice este formato:

    //iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
    

    Para obtener más información, consulte Autenticar una carga de trabajo mediante la API REST.

  • Correo electrónico de cuenta de servicio: la dirección de correo electrónico de la cuenta de servicio de Google que se va a suplantar. Para obtener más información, consulte Creación de una cuenta de servicio para la carga de trabajo externa.

  • Tiempo de vida de señal de cuenta de servicio (opcional): el tiempo de vida en segundos de la señal de acceso de cuenta de servicio. El tiempo de vida predeterminado de una señal de acceso de cuenta de servicio es de una hora. Para obtener más información, consulte Credenciales de origen URL.

  • Formato de señal: Texto o JSON con el nombre del campo Señal para el nombre del campo en la respuesta JSON que contiene la señal.

  • Nombre de campo de señal: el nombre del campo en la respuesta JSON que contiene la señal. Este campo sólo aparece cuando el Formato de señal es JSON.

  • Tipo de señal: solicitud AWS Signature Versión 4, Google OAuth 2.0 señal de acceso, señal de ID, JSON Web Token (JWT) o SAML 2.0.

Detalles de conexión de federación de identidades de carga de trabajo con URL de señal

  • Audiencia de servicio de señal de seguridad: la audiencia de servicio de señal de seguridad que contiene el ID de proyecto, el ID de agrupación y el ID de proveedor. Utilice este formato:

    //iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
    

    Para obtener más información, consulte Autenticar una carga de trabajo mediante la API REST.

  • Correo electrónico de cuenta de servicio: la dirección de correo electrónico de la cuenta de servicio de Google que se va a suplantar. Para obtener más información, consulte Creación de una cuenta de servicio para la carga de trabajo externa.

  • Tiempo de vida de señal de cuenta de servicio (opcional): el tiempo de vida en segundos de la señal de acceso de cuenta de servicio. El tiempo de vida predeterminado de una señal de acceso de cuenta de servicio es de una hora. Para obtener más información, consulte Credenciales de origen URL.

  • URL de señal: el URL para recuperar una señal.

  • Método HTTP: método HTTP que se debe utilizar para la solicitud de URL de señal: GET, POST o PUT.

  • Cuerpo de solicitud (para métodos POST o PUT): el cuerpo de la solicitud HTTP para recuperar una señal.

  • Cabeceras HTTP: cabeceras HTTP para la solicitud de URL de señal en JSON o como un cuerpo JSON. Utilice el formato: "Key1"="Value1","Key2"="Value2".

  • Formato de señal: Texto o JSON con el nombre del campo Señal para el nombre del campo en la respuesta JSON que contiene la señal.

  • Nombre de campo de señal: el nombre del campo en la respuesta JSON que contiene la señal. Este campo sólo aparece cuando el Formato de señal es JSON.

  • Tipo de señal: solicitud AWS Signature Versión 4, Google OAuth 2.0 señal de acceso, señal de ID, JSON Web Token (JWT) o SAML 2.0.

Proxy de servidor (opcional)

Seleccione Proxy de servidor para acceder al origen de datos Google BigQuery a través de un servidor proxy HTTPS. En función de su configuración, un servidor proxy puede proporcionar equilibrio de carga, mayor seguridad y privacidad. Los valores del servidor proxy son independientes de las credenciales de autenticación y de la selección de credenciales personales o compartidas.

  • Host de proxy: el nombre de host o las direcciones IP del servidor proxy HTTPS. Por ejemplo, proxy.example.com o 192.0.2.0.
  • Puerto de proxy: el número de puerto para conectarse al servidor proxy HTTPS. Por ejemplo, 8080 o 8443.
  • Nombre de usuario de proxy y Contraseña de proxy.

Otras propiedades

ID de proyecto (opcional) ID del proyecto Google .

Formato de serie JSON de salida: formato de serie JSON para valores de salida que son tipos de datos complejos (por ejemplo, anidados o repetidos).

  • Bonito: los valores se formatean antes de enviarlos a la salida. Utilice esta opción para leer visualmente unas pocas filas.
  • Sin formato: (valor predeterminado) Sin formato. Utilice esta opción para obtener el mejor rendimiento.

Descubrimiento de metadatos: el valor determina si los comentarios sobre columnas (observaciones) y alias para objetos de esquema como tablas o vistas (sinónimos) se recuperan cuando se añaden activos utilizando esta conexión.

Permisos

La conexión a Google BigQuery requiere los siguientes permisos de BigQuery:

  • bigquery.job.create
  • bigquery.tables.get
  • bigquery.tables.getData

Hay tres maneras de obtener estos permisos:

  • Utilice el rol de IAM de BigQuery Cloud predefinido bigquery.admin, que incluye estos permisos;
  • Utilice una combinación de dos roles, uno de cada columna de la tabla siguiente; o
  • Cree un rol personalizado. Véase Crear y gestionar roles personalizados.
Primer rol Segundo rol
bigquery.dataEditor bigquery.jobUser
bigquery.dataOwner bigquery.user
bigquery.dataViewer

Para obtener más información sobre permisos y funciones en Google BigQuery, consulta Funciones y permisos predefinidos.

Elija el método para crear una conexión basada en el lugar en el que se encuentra en la plataforma

En un proyecto
Pulse Activos > Nuevo activo > Conectar a un origen de datos. Consulte Adición de una conexión a un proyecto.
En un espacio de despliegue
Pulse Importar activos > Acceso a datos > Conexión. Consulte Adición de activos de datos a un espacio de despliegue.
En el catálogo de activos de la plataforma
Pulse Nueva conexión. Consulte Adición de conexiones de plataforma.

Paso siguiente: Añadir activos de datos desde la conexión

Dónde puede utilizar esta conexión

Puede utilizar las conexiones de Google BigQuery en los siguientes espacios de trabajo y herramientas:

Proyectos

  • Data Refinery
  • SPSS Modeler
  • Synthetic Data Generator

Catálogos

  • Platform assets catalog

Configuración de Google BigQuery

Inicio rápido utilizando la consola de Cloud

Más información

Tema principal: Conexiones soportadas

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información