Go back to the English version of the documentation在Data Virtualization中从多个数据源创建虚拟表
在Data Virtualization中从多个数据源创建虚拟分组表
Last updated: 2024年11月26日
您可以将来自多个数据源的表组合到单个虚拟表中,这将创建包含来自所有参与数据源的列和数据的统一定义。 这些表称为分组表。
分段是垂直的 (根据所选列的选择,是列的子集或超集)。 您可以对生成的虚拟表运行查询的方式与查询任何基本表的方式相同。
如果由驱动程序解析的表的名称相同 (完全匹配,区分大小写) ,那么可以将表分组到单个虚拟化表中。 表分组语义将具有相同名称 (不区分大小写) 的列视为匹配。 数据类型提升遵循优先顺序规则。
必须确保表的分组是逻辑的,特别是关于结果分组表的数据类型的处理。 在某些情况下,相应的列可能具有不同的数据类型。 规则用于确定分组表的结果数据类型。 有关更多信息,请参阅 结果数据类型的规则。
要防止意外结果,在将表分组到单个虚拟化表时必须小心。 创建分组表时,可以考虑以下建议,尽管没有任何限制。
- 确保所有表中具有相同名称的列具有兼容的数据类型和兼容的业务用途。 所有表中的数据域必须兼容。
- 对相同类型的数据源中的表进行分组,以确保数据语义一致。
- 对来自不同类型数据源的表进行分组时,请确保数据语义一致。
- 确保组中的所有表都具有大多数具有相同名称的列。 确保匹配的列具有兼容的数据类型。
- 请勿包含在复杂类型上定义的列。
注: 某些数据源 (例如 Hive) 对表名称使用小写缺省值。 除非使用定界标识来确保表名的完全匹配,否则不能将这些表与其他数据源中的表进行分组,这些表的缺省值为大写。
关于本任务
这些步骤描述了如何在没有业务术语的情况下虚拟化数据。 如果要管理虚拟数据,请参阅 Data Virtualization中的管理虚拟数据。
过程
下一步操作
- 您可以收集虚拟对象的统计信息。 有关详细信息,请参阅 Data Virtualization中收集统计数据。
在 " 虚拟化数据 " 页面上,可以将虚拟对象发布到目录。 有关详细信息,请参阅 Data Virtualization中的将虚拟数据发布到目录。
- 您还可以创建连接多个虚拟表以创建连接视图。 请参阅 从多个表创建连接视图。