可使用 Data Virtualization 创建虚拟表,以拆分或组合来自一个或多个表中的数据。 Data Virtualization 将多个数据源连接到能够自我均衡的单一数据源或数据库集合。 阅读有关Data Virtualization工具的信息,然后观看视频并学习教程,该教程适合具有一定数据虚拟化知识但不需要编码的用户。
- 必需服务
- Data Virtualization
- 可选服务
- watsonx.ai工作室
- IBM Knowledge Catalog
基本工作流程包含以下任务:
- 配置服务并创建服务凭证。
- 在多个数据源中创建数据库,并收集数据库详细信息和凭证。
- 添加与数据源的连接。
- 通过组合来自所有数据源的数据,创建虚拟对象。
- 管理对虚拟对象的访问。
- 将虚拟化的数据添加到目录和项目。
- 使用 IBM Db2 Data Management Console 监视服务实例。
阅读有关 Data Virtualization 的信息
通过 Data Virtualization 服务,可连接到多个数据源,创建和管理虚拟资产,并使用虚拟化的数据。
- 连接:首先连接到数据源。 可连接到多个数据源。 有关详细信息,请参阅连接到Data Virtualization中的数据源和 Data Virtualization中支持的数据源。
- 联接、创建和管理:然后创建虚拟表,按模式对表进行分组,将数据与项目关联,并且管理虚拟资产。 更多信息,请参阅 "创建虚拟化对象和 "管理 "Data Virtualization中的虚拟数据 "。
- 使用: 最后,使用项目,数据目录和其他应用程序中的虚拟表。 有关更多信息,请参阅 分析数据和构建模型。
观看有关 Data Virtualization 的视频
观看本视频,了解如何使用 "Data Virtualization服务将数据虚拟化到项目或目录中。
此视频提供了一种可视方法来学习本文档中的概念和任务。
尝试教程以虚拟化数据
在本教程中,您将完成以下任务:
完成本教程大约需要 30 分钟。
完成本教程的提示
以下是成功完成本教程的一些提示。
使用视频图片
以下动画图像显示了如何使用视频图片和目录功能:
在社区中获取帮助
如果您需要本教程的帮助,可以在Cloud Pak for Data社区讨论区提问或寻找答案。
设置浏览器窗口
为了获得完成本教程的最佳体验,请在一个浏览器窗口中打开 Cloud Pak for Data ,并在另一个浏览器窗口中保持本教程页面处于打开状态,以便在两个应用程序之间轻松切换。 请考虑将两个浏览器窗口并排排列,以便更轻松地进行后续操作。
任务 1: 打开项目
To preview this task, watch the video beginning at 00:10.
您需要一个项目来存储虚拟化数据。 执行以下步骤以打开现有项目或创建新项目。
从导航菜单",选择项目 > 查看所有项目
如果现有一个项目,请将其打开。
如果您没有现有项目,请单击 新建项目。
选择创建空项目。
输入项目的名称和可选描述。
选择现有的对象存储服务实例或者创建新的对象存储服务实例。
单击创建。
要获取更多信息或观看视频,请参阅创建项目。
检查您的进度
下图显示了一个新的空项目。
任务 2: 供应必需的服务
To preview this task, watch the video beginning at 00:32.
本教程需要Data Virtualization服务以及可选服务watsonx.aiStudio 和IBM Knowledge Catalog。 执行以下步骤以创建这些服务:
从导航菜单",单击服务 > 服务实例。
如果列出了 Data Virtualization 服务,那么不需要配置另一个实例。 否则,请完成以下步骤:
单击添加服务。
选择数据虚拟化。
选择Data Virtualization 精简版计划。
单击创建。
验证是否在 " 服务实例 " 页面上供应了这些服务。
更多信息,请参见 "Data Virtualization在 "Cloud Pak for Data as a Service上 。
检查您的进度
下图显示了供应的服务。
任务 3: 向 Db2 Warehouse 数据源添加连接
To preview this task, watch the video beginning at 00:58.
您需要先创建与数据源的连接,然后才能虚拟化数据。 执行以下步骤以在 Data Virtualization中创建连接:
从导航菜单",选择数据>Data virtualization。 这样会显示已配置的数据源的列表。
单击 添加连接> 新建连接。
选择 Db2 Warehouse on Cloud,然后单击 选择。
使用以下信息完成连接详细信息:
- 名称:
Db2 Warehouse
- 数据库:
BLUDB
- 主机名或 IP 地址:
db2w-ruggyab.us-south.db2w.cloud.ibm.com
- 端口:
50001
- 用户名:
CPDEMO
- 密码:
DataFabric@2022IBM
- 选中 端口已启用 SSL 复选框。
- 名称:
单击测试。
单击创建。
有关详细信息,请参阅 Data Virtualization中连接数据源。
检查您的进度
下图显示了 "数据源" 页面。
任务 4: 将表添加到虚拟化数据
To preview this task, watch the video beginning at 01:45.
通过定义连接,可以虚拟化来自该数据源的数据。 执行以下步骤以将表添加到虚拟化数据。
从 Data Virtualization 菜单中,选择 虚拟化> 虚拟化,然后等待装入可用表。
从列表中找到并选择 customers 和 sales 表,然后单击添加到购物车。
单击查看购物车。
清除 分配给项目 字段。 这会将这两个表添加到虚拟化数据列表中,但不会将它们添加到项目中。 稍后,您将向项目添加虚拟化数据。
单击虚拟化。
单击确认。
单击 转至虚拟化数据。
有关详细信息,请参阅 Data Virtualization中的创建虚拟对象。
检查您的进度
下图显示了 "我的虚拟化数据" 页面。
任务 5: 将虚拟化数据发布到目录和项目
To preview this task, watch the video beginning at 02:43.
接下来,执行以下步骤来连接两个表,以创建虚拟化资产并将其发布到目录和项目:
在 " 虚拟化数据 " 屏幕上,从列表中选择 客户 和 销售 表,然后单击 连接。
对于每个表,搜索
salesrep
。连接这两个表中的 SALESREP_ID 列。
单击下一步。
查看联接的表,然后单击下一步。
对于视图名称,输入
joined_customers_sales_table
。从列表中选择一个项目。
选中发布到目录选项,然后选择一个目录。
单击创建视图。
该过程完成后,可查看项目或目录以预览虚拟化数据。 您需要有 IBM Cloud API 密钥才能查看项目或目录中的数据。 请参阅创建 IBM Cloud API 密钥。
有关详细信息,请参阅 Data Virtualization中的管理虚拟数据。
检查您的进度
下图显示了目录中的虚拟化数据资产。
后续步骤
现在,虚拟数据已准备就绪,可供使用。 例如,您可执行以下任何任务:
其他资源
观看更多视频。
在资源中心查找样本数据集。
请尝试此附加教程,以获得更多关于 "Data Virtualization:"Data Virtualization在 "IBM Cloud Pak for Data上 :"的实践经验。
父主题: 快速入门教程