在Data Virtualization中从多个数据源创建虚拟分组表

Go back to the English version of the documentation

在Data Virtualization中从多个数据源创建虚拟表

Last updated: 2024年11月26日

在Data Virtualization中从多个数据源创建虚拟分组表

您可以将来自多个数据源的表组合到单个虚拟表中，这将创建包含来自所有参与数据源的列和数据的统一定义。这些表称为分组表。

分段是垂直的 (根据所选列的选择，是列的子集或超集)。您可以对生成的虚拟表运行查询的方式与查询任何基本表的方式相同。

如果由驱动程序解析的表的名称相同 (完全匹配，区分大小写) ，那么可以将表分组到单个虚拟化表中。表分组语义将具有相同名称 (不区分大小写) 的列视为匹配。数据类型提升遵循优先顺序规则。

必须确保表的分组是逻辑的，特别是关于结果分组表的数据类型的处理。在某些情况下，相应的列可能具有不同的数据类型。规则用于确定分组表的结果数据类型。有关更多信息，请参阅结果数据类型的规则。

要防止意外结果，在将表分组到单个虚拟化表时必须小心。创建分组表时，可以考虑以下建议，尽管没有任何限制。

确保所有表中具有相同名称的列具有兼容的数据类型和兼容的业务用途。所有表中的数据域必须兼容。
对相同类型的数据源中的表进行分组，以确保数据语义一致。
对来自不同类型数据源的表进行分组时，请确保数据语义一致。
确保组中的所有表都具有大多数具有相同名称的列。确保匹配的列具有兼容的数据类型。
请勿包含在复杂类型上定义的列。

注: 某些数据源 (例如 Hive) 对表名称使用小写缺省值。除非使用定界标识来确保表名的完全匹配，否则不能将这些表与其他数据源中的表进行分组，这些表的缺省值为大写。

关于本任务

这些步骤描述了如何在没有业务术语的情况下虚拟化数据。如果要管理虚拟数据，请参阅 Data Virtualization中的管理虚拟数据。

过程

在导航菜单上，单击数据 > Data virtualization。
缺省情况下，服务菜单将打开到 " 数据源 " 页面。
在服务菜单上，单击虚拟化 > 虚拟化，然后单击表选项卡。

连接列表将显示在缺省 " 浏览 " 视图中。单击连接，模式或表以将其选中并预览内容。

连接中可用表的列表将显示在 " 列表 " 视图中。您可以通过在 " 数据源 " 页面上添加过滤器来过滤列出的表。此外，可以按名称，模式，列或业务术语搜索表。

Data Virtualization可自动建议可合并为单一虚拟表的匹配表。
要将表组合到单个虚拟对象中，请单击设置，然后在设置菜单中选择具有相同名称的组表。

此屏幕显示建议的表分组，您可以在复审步骤中对参与的源表进行微调。

可用表的列表包含其中未授予读许可权的表（不可读的表）。
如果创建包含不可读表的虚拟表，请选择下列其中一个选项以使虚拟表可查询。
- 选项 1 单击表操作菜单上的编辑分组表，并从要虚拟化的组中除去不可读的表。
- 选项 2 确保分配给数据源连接的用户可以访问不可读的表。此步骤可以在虚拟化表之前或之后执行。
- 方案 3在Data Virtualization中创建一个数据源连接，以访问同一数据源，并为有读取表权限的单独用户提供凭据。因此，选择对同名的表分组选项时，会显示其他表实例的列表。虚拟化表之前，仍必须手动移除受限用户的连接下发现的不可读的表（如选项 1 中所述）。
选择要虚拟化的表，然后单击添加到购物车。
单击查看购物车可查看您的选择。在此窗口中，您还可以编辑表和模式名称，或者从购物车中除去选择。

选择相应的操作以分配虚拟化表。

分配目标	何时使用此选项
Project	如果已创建要在特定项目中使用的虚拟表，请选择项目。然后，选择相应的项目。该表还显示在虚拟化数据中。
虚拟化数据	如果未创建要在特定项目中使用的表，请选择虚拟化数据。如果不存在任何项目，那么此设置是缺省设置。

如果还想要发布到所选目录，请选择发布到目录。
下拉菜单中显示了可用目录的列表。每个目录都标记为受管或不受管。
注意：您必须在IBM Knowledge Catalog中至少有一个目录。
您必须有权发布到目录。管理员可以启用是否将所有虚拟对象发布到所选受管目录，这将阻止用户发布到指定目录。
在模式字段中指定模式。
您还可以通过执行以下步骤来创建模式。
- 如果您具有Data Virtualization 工程师或用户角色，请将模式字段保留为默认值，以便用您的用户 ID 创建模式。
- 如果您具有Data Virtualization 管理器角色，请将模式字段保留为默认值，以便使用您的用户 ID 创建模式，或在模式字段中输入新模式名称。
有关更多信息，请参阅为虚拟对象创建模式。
单击虚拟化以完成此过程。
在显示状态窗口时，您可以选择查看虚拟化数据或虚拟化更多数据。
单击查看虚拟化数据以查看新创建的表。

下一步操作

您可以收集虚拟对象的统计信息。有关详细信息，请参阅 Data Virtualization中收集统计数据。
在 " 虚拟化数据 " 页面上，可以将虚拟对象发布到目录。有关详细信息，请参阅 Data Virtualization中的将虚拟数据发布到目录。
您还可以创建连接多个虚拟表以创建连接视图。请参阅从多个表创建连接视图。