要在 Google Cloud Storage中访问数据,请为其创建连接资产。
Google Cloud Storage 是用于在 Google Cloud Platform Infrastructure 上存储和访问数据的联机文件存储 Web Service。
创建与 Google Cloud Storage 的连接
要创建连接资产,请选择认证方法。 选项包括使用或不使用工作负载身份联合的认证。
没有工作负载身份联合
- 帐户密钥 (完整 JSON 片段): Google 服务帐户密钥 JSON 文件的内容
- 客户机标识,客户机密钥,访问令牌和刷新令牌
使用工作负载身份联合
使用外部身份提供者 (IdP) 进行认证。 外部身份提供者使用 Identity and Access Management (IAM) 而不是服务帐户密钥。 IAM 提供了更高的安全性和集中管理。 您可以将工作负载身份联合认证与访问令牌或令牌 URL 配合使用。
您可以配置Google BigQuery连接,以便与任何符合OpenIDConnect (OIDC) 规范并满足准备外部IdP 中所述Google Cloud要求的身份提供商进行工作量身份联合。 要求包括:
- 身份提供者必须支持 OpenID Connect 1.0。
- 身份提供者的 OIDC 元数据和 JWKS 端点必须可通过因特网公开访问。 Google Cloud 使用这些端点来下载身份提供者的密钥集,并使用该密钥集来验证令牌。
- 已配置身份提供者,以便您的工作负载可以获取满足以下条件的标识令牌:
- 令牌使用 RS256 或 ES256 算法进行签名。
- 令牌包含 aud 声明。
有关Amazon Web ServicesAWS) 和Microsoft Azure 的工作负载身份联合配置步骤示例,请参阅 .NET Framework 3.0。
具有访问令牌连接的工作负载身份联合详细信息
访问令牌: 来自身份提供者的访问令牌,用于连接到 BigQuery。
安全性令牌服务受众: 包含项目标识,池标识和提供者标识的安全性令牌服务受众。 使用以下格式:
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
有关更多信息,请参阅使用 REST API 验证工作负载。
服务帐户电子邮件: 要模拟的 Google 服务帐户的电子邮件地址。 有关详细信息,请参阅为外部工作负载创建服务帐户。
服务帐户令牌生存期 (可选): 服务帐户访问令牌的生存期 (以秒为单位)。 服务帐户访问令牌的缺省生存期为 1 小时。 更多信息,请参阅URL 源凭证。
令牌格式: 包含令牌的 JSON 响应中的字段名称的 "令牌" 字段名称的文本或 JSON。
令牌字段名称:JSON 响应中包含令牌的字段的名称。 仅当 令牌格式 为 JSON 时,才会显示此字段。
令牌类型: AWS Signature Version 4 请求, Google OAuth 2.0 访问令牌,标识令牌, JSON Web 令牌 (JWT) 或 SAML 2.0。
具有令牌 URL 连接的工作负载身份联合详细信息
安全性令牌服务受众: 包含项目标识,池标识和提供者标识的安全性令牌服务受众。 使用以下格式:
//iam.googleapis.com/projects/PROJECT_NUMBER/locations/global/workloadIdentityPools/POOL_ID/providers/PROVIDER_ID
有关详细信息,请参阅使用 REST API 验证工作负载。
服务帐户电子邮件: 要模拟的 Google 服务帐户的电子邮件地址。 有关详细信息,请参阅为外部工作负载创建服务帐户。
服务帐户令牌生存期 (可选): 服务帐户访问令牌的生存期 (以秒为单位)。 服务帐户访问令牌的缺省生存期为 1 小时。 更多信息,请参阅URL 源凭证。
令牌 URL: 用于检索令牌的 URL。
HTTP 方法: 用于令牌 URL 请求的 HTTP 方法 :GET , POST 或 PUT。
请求主体 (对于 POST 或 PUT 方法): 用于检索令牌的 HTTP 请求的主体。
HTTP 头:JSON 格式或作为 JSON 主体的令牌 URL 请求的 HTTP 头。 使用格式:
"Key1"="Value1","Key2"="Value2"
。令牌格式: 包含令牌的 JSON 响应中的字段名称的 "令牌" 字段名称的文本或 JSON。
令牌字段名称:JSON 响应中包含令牌的字段的名称。 仅当 令牌格式 为 JSON 时,才会显示此字段。
令牌类型: AWS Signature Version 4 请求, Google OAuth 2.0 访问令牌,标识令牌, JSON Web 令牌 (JWT) 或 SAML 2.0。
服务器代理(可选)
选择 Server proxy 以通过 HTTPS 代理服务器访问 Google Cloud Storage 数据源。 根据不同的设置,代理服务器可以提供负载平衡、增强安全性和隐私保护。 代理服务器设置与身份验证凭据和个人或共享凭据选择无关。 可提供 SSL 证书,以提高安全性。
- 代理主机:HTTPS 代理服务器的主机名或 IP 地址。 例如,
proxy.example.com
或192.0.2.0
。 - 代理端口:连接 HTTPS 代理服务器的端口号。 例如,
8080
或8443
。 - 代理用户名和 代理密码。
其他属性
项目标识 (可选) Google 项目的标识。
根据您在平台中的位置选择创建连接的方法
- 在项目中
- 单击 资产> 新资产> 连接到数据源。 请参阅将连接添加到项目。
- 在目录中
- 单击 添加到目录> 连接。 请参阅将连接资产添加到目录中。
- 在部署空间中
- 单击 导入资产> 数据访问> 连接。 请参阅 向部署空间添加数据资产。
- 在平台资产目录中
- 单击新建连接。 请参阅添加平台连接。
下一步:从连接添加数据资产
请参阅通过项目中的连接添加数据。
请参阅从目录中的连接添加数据。
您可以在何处使用此连接
您可以在以下工作空间和工具中使用 Google Cloud Storage 连接:
项目
- Data Refinerywatsonx.aiStudio 或IBM Knowledge Catalog
- DataStage (DataStage 服务)。 请参阅 连接到 DataStage中的数据源。
- Decision Optimization(watsonx.ai工作室和 "watsonx.ai运行时)
- Metadata import (IBM Knowledge Catalog)
- SPSS Modelerwatsonx.aiStudio)
目录
Platform assets catalog
其他目录 (IBM Knowledge Catalog)
支持的文件类型
Google Cloud Storage 连接支持以下文件类型 :Avro , CSV ,定界文本, Excel , JSON , ORC , Parquet , SAS , SAV , SHP 和 XML。
表格格式
Google Cloud Storage 连接支持这些 Data Lake 表格式:三角洲湖和冰山。
了解更多信息
父主题: 支持的连接