Para acceder a sus datos en Google Cloud Storage, cree un activo de conexión para el mismo.
Google Cloud Storage es un servicio web de almacenamiento de archivos en línea para almacenar y acceder a datos en la infraestructura de Google Cloud Platform.
Crear una conexión con Google Cloud Storage
Para crear el activo de conexión, elija un método de autenticación. Las opciones incluyen una autenticación con o sin federación de identidad de carga de trabajo.
Sin federación de identidad de carga de trabajo
- Clave de cuenta (fragmento de código JSON completo): el contenido del archivo JSON de clave de cuenta de servicio de Google
- ID de cliente, secreto de cliente, señal de acceso y señal de renovación
Con federación de identidad de carga de trabajo
Utilice un proveedor de identidad externo (IdP) para la autenticación. Un proveedor de identidad externo utiliza Identity and Access Management (IAM) en lugar de claves de cuenta de servicio. IAM proporciona una mayor seguridad y una gestión centralizada. Puede utilizar la autenticación de federación de identidad de carga de trabajo con una señal de acceso o con un URL de señal.
Puede configurar una conexión de Google BigQuery para la federación de identidades de carga de trabajo con cualquier proveedor de identidades que cumpla con la especificación OpenID Connect (OIDC) y que satisfaga los requisitos de Google Cloud que se describen en Prepare su IdP externo. Los requisitos incluyen:
- El proveedor de identidad debe dar soporte a OpenID Connect 1.0.
- Los metadatos OIDC del proveedor de identidad y los puntos finales JWKS deben ser accesibles públicamente a través de Internet. Google Cloud utiliza estos puntos finales para descargar el conjunto de claves del proveedor de identidades y utiliza dicho conjunto de claves para validar señales.
- El proveedor de identidad está configurado para que la carga de trabajo pueda obtener señales de ID que cumplan estos criterios:
- Las señales se firman con el algoritmo RS256 o ES256 .
- Las señales contienen una reclamación aud.
Para ver ejemplos de los pasos de configuración de la federación de identidades de la carga de trabajo para Amazon Web ServicesAWS) y Microsoft Azure, consulte .
Detalles de federación de identidades de carga de trabajo con conexión de señal de acceso
Señal de acceso: una señal de acceso del proveedor de identidades para conectarse a BigQuery.
Audiencia de servicio de señal de seguridad: la audiencia de servicio de señal de seguridad que contiene el ID de proyecto, el ID de agrupación y el ID de proveedor. Utilice este formato:
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
Para obtener más información, consulte Autenticar una carga de trabajo mediante la API REST.
Correo electrónico de cuenta de servicio: la dirección de correo electrónico de la cuenta de servicio de Google que se va a suplantar. Para obtener más información, consulte Creación de una cuenta de servicio para la carga de trabajo externa.
Tiempo de vida de señal de cuenta de servicio (opcional): el tiempo de vida en segundos de la señal de acceso de cuenta de servicio. El tiempo de vida predeterminado de una señal de acceso de cuenta de servicio es de una hora. Para obtener más información, consulte Credenciales de origen URL.
Formato de señal: Texto o JSON con el nombre del campo Señal para el nombre del campo en la respuesta JSON que contiene la señal.
Nombre de campo de señal: el nombre del campo en la respuesta JSON que contiene la señal. Este campo sólo aparece cuando el Formato de señal es JSON.
Tipo de señal: solicitud AWS Signature Versión 4, Google OAuth 2.0 señal de acceso, señal de ID, JSON Web Token (JWT) o SAML 2.0.
Detalles de conexión de federación de identidades de carga de trabajo con URL de señal
Audiencia de servicio de señal de seguridad: la audiencia de servicio de señal de seguridad que contiene el ID de proyecto, el ID de agrupación y el ID de proveedor. Utilice este formato:
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
Para obtener más información, consulte Autenticar una carga de trabajo mediante la API REST.
Correo electrónico de cuenta de servicio: la dirección de correo electrónico de la cuenta de servicio de Google que se va a suplantar. Para obtener más información, consulte Creación de una cuenta de servicio para la carga de trabajo externa.
Tiempo de vida de señal de cuenta de servicio (opcional): el tiempo de vida en segundos de la señal de acceso de cuenta de servicio. El tiempo de vida predeterminado de una señal de acceso de cuenta de servicio es de una hora. Para obtener más información, consulte Credenciales de origen URL.
URL de señal: el URL para recuperar una señal.
Método HTTP: método HTTP que se debe utilizar para la solicitud de URL de señal: GET, POST o PUT.
Cuerpo de solicitud (para métodos POST o PUT): el cuerpo de la solicitud HTTP para recuperar una señal.
Cabeceras HTTP: cabeceras HTTP para la solicitud de URL de señal en JSON o como un cuerpo JSON. Utilice el formato:
"Key1"="Value1","Key2"="Value2"
.Formato de señal: Texto o JSON con el nombre del campo Señal para el nombre del campo en la respuesta JSON que contiene la señal.
Nombre de campo de señal: el nombre del campo en la respuesta JSON que contiene la señal. Este campo sólo aparece cuando el Formato de señal es JSON.
Tipo de señal: solicitud AWS Signature Versión 4, Google OAuth 2.0 señal de acceso, señal de ID, JSON Web Token (JWT) o SAML 2.0.
Proxy de servidor (opcional)
Seleccionar servidor proxy para acceder al Google Cloud Storage fuente de datos a través de un servidor proxy HTTPS. Dependiendo de su configuración, un servidor proxy puede proporcionar equilibrio de carga, mayor seguridad y privacidad. La configuración del servidor proxy es independiente de las credenciales de autenticación y de la selección de credenciales personales o compartidas. Se puede proporcionar un certificado SSL para mayor seguridad.
- anfitrión proxy : El nombre de host o la dirección IP del servidor proxy HTTPS. Por ejemplo,
proxy.example.com
o192.0.2.0
. - Puerto proxy : El número de puerto para conectarse al servidor proxy HTTPS. Por ejemplo,
8080
o8443
. - Nombre de usuario proxy y Contraseña de proxy.
Otras propiedades
ID de proyecto (opcional) ID del proyecto Google .
Elija el método para crear una conexión basada en el lugar en el que se encuentra en la plataforma
- En un proyecto
- Pulse Activos > Nuevo activo > Conectar a un origen de datos. Consulte Adición de una conexión a un proyecto.
- En un espacio de despliegue
- Pulse Importar activos > Acceso a datos > Conexión. Consulte Adición de activos de datos a un espacio de despliegue.
- En el catálogo de activos de la plataforma
- Pulse Nueva conexión. Consulte Adición de conexiones de plataforma.
Paso siguiente: Añadir activos de datos desde la conexión
Dónde puede utilizar esta conexión
Puede utilizar las conexiones de Google Cloud Storage en los siguientes espacios de trabajo y herramientas:
Proyectos
- Data Refinery
- Decision Optimization
- SPSS Modeler
- Synthetic Data Generator
Catálogos
- Platform assets catalog
Tipos de archivos soportados
La conexión de Google Cloud Storage da soporte a estos tipos de archivo: Avro, CSV, Texto delimitado, Excel, JSON, ORC, Parquet, SAS, SAV, SHP y XML.
Formatos de tabla
El Google Cloud Storage La conexión admite estos formatos de tabla de Data Lake: Delta Lake e Iceberg.
Más información
Tema principal: Conexiones soportadas