执行本教程以配置客户的 360 度视图,并使用数据光纤网试用的 Master Data Management 用例来探索这些客户。 本教程的目标是将客户数据与信用评分数据相结合,以解析数据中的实体,创建客户的整合 360 视图,以及确定要在营销活动中成为目标的最高价值客户,并确定提供这些客户的最佳费率。
技术预览 这是技术预览,尚不支持用于生产环境。
本教程的故事是, Golden Bank 希望运行一个营销活动来提供更低的抵押贷款利率。 作为数据工程师,您必须使用 IBM Match 360 为客户的 360 度视图设置,映射和建模数据。
以下动画图像提供了在本教程结束时将完成的内容的快速预览。 您将设置并添加资产以主数据,映射数据资产属性,发布数据模型并运行匹配,将匹配的数据发布到目录,然后浏览并可视化匹配的数据。 单击该图像以查看更大的图像。
预览教程
在本教程中,您可以完成以下任务:
- 设置先决条件
- 任务 1:为匹配的数据创建目录
- 任务 2:在主数据中设置和添加资产
- 任务 3:映射数据资产属性
- 任务 4:发布数据模型并运行匹配
- 任务 5:将匹配的数据发布到目录中
- 任务 6:预览匹配的数据
- 任务 7:调整匹配算法并运行匹配
- 任务 8:深入了解匹配结果
- 任务 9:可视化实体记录
- 清除(可选)
观看此视频以预览本教程中的步骤。 视频中显示的用户界面可能存在细微差异。 该视频旨在与编写的教程相伴。
此视频提供了一种可视方法来学习本文档中的概念和任务。
完成本教程的提示
以下是成功完成本教程的一些提示。
使用视频图片
以下动画图像显示了如何使用视频图片和目录功能:
在社区中获取帮助
如果您需要本教程的帮助,可以在Cloud Pak for Data社区讨论区提问或寻找答案。
设置浏览器窗口
为了获得完成本教程的最佳体验,请在一个浏览器窗口中打开 Cloud Pak for Data ,并在另一个浏览器窗口中保持本教程页面处于打开状态,以便在两个应用程序之间轻松切换。 请考虑将两个浏览器窗口并排排列,以便更轻松地进行后续操作。
设置先决条件
注册 Cloud Pak for Data as a Service
您必须注册 Cloud Pak for Data as a Service ,并为 Master Data Management 用例供应必要的服务。
- 如果您具有现有的 Cloud Pak for Data as a Service 帐户,那么可以开始使用本教程。 如果您有轻量套餐帐户,那么每个帐户只有一个用户可以运行本教程。
- 如果您还没有 Cloud Pak for Data as a Service 帐户,请 注册以获取数据光纤网试用。
观看以下视频,了解Cloud Pak for Data 中的数据结构。
此视频提供了一种可视方法来学习本文档中的概念和任务。
验证必需的供应服务
To preview this task, watch the video beginning at 00:50.
请遵循以下步骤来验证或供应必需的服务。
在 Cloud Pak for Data中,验证您是否位于达拉斯区域中。 如果没有,请单击区域下拉列表,然后选择 达拉斯。
从导航菜单",选择服务 > 服务实例。
使用 产品 下拉框来确定是否存在 IBM Match 360 with Watson 服务实例。
如果需要创建 IBM Match 360 服务实例,请单击 添加服务。
选择 IBM Match 360 with Watson。
对于区域,选择 达拉斯。
选择轻量套餐。
可选: 输入 IBM Match 360 with Watson 服务实例的名称。
单击创建。
重复这些步骤以验证或供应以下服务:
- IBM Knowledge Catalog
- Cloud Object Storage
检查您的进度
下图显示了供应的服务实例:
创建样本项目
To preview this task, watch the video beginning at 01:29.
遵循以下步骤为本教程创建样本项目:
访问资源中心的Master Data Management示例项目。
单击创建项目。
如果提示将项目与 Cloud Object Storage 实例相关联,请从列表中选择 Cloud Object Storage 实例。
单击创建。
等待项目导入完成,然后单击 查看新项目 以验证是否已成功创建项目和资产。
注: 如果这是您第一次访问项目,那么您将看到一个引导式导览,询问您是否需要项目的导览。 现在,请单击 可能稍后。单击 资产 选项卡以查看项目的资产。
检查您的进度
下图显示了样本项目。 现在,您已准备好开始本教程。
任务 1: 为匹配的数据创建目录
To preview this task, watch the video beginning at 02:08.
您需要主数据的目录以及对匹配数据的访问权。 通过 IBM Knowledge Catalog Lite 套餐,您可以创建两个目录。 如果您已有两个目录,那么可以使用其中一个现有目录,并验证您是否是要使用的目录的编辑者。
选项 1: 使用缺省目录
执行以下步骤以验证您是否具有使用缺省目录的相应访问权:
从导航菜单",选择目录 > 查看所有目录
打开要用于本教程的目录。
单击 访问控制 选项卡。
验证您的帐户是否具有 编辑者 角色。 如果您的访问权是 查看者,请与管理员联系以请求 编辑者 访问权。
选项 2: 创建新目录
否则,请执行以下步骤来创建目录:
在 " 目录 " 页面上,单击 创建目录。
对于 名称,复制并粘贴目录名称,如下所示,没有前导或尾部空格:
Mortgage Approval Catalog
选择 强制实施数据保护规则,确认选择并接受其他字段的缺省值。
单击 创建 以使用缺省设置。 新目录随即打开。
检查您的进度
下图显示了您的目录。 现在有了目录,您可以设置主数据并添加数据资产。
任务 2: 设置资产并将其添加到主数据
To preview this task, watch the video beginning at 02:48.
您必须将要合并的所有数据资产添加到主数据。 数据源可以来自包含计算机硬盘的源,也可以来自项目或目录的数据资产。
从导航菜单",选择数据 > 主数据。
如果需要设置主数据,请单击 设置主数据 ,然后执行将所需项目和服务与主数据相关联的步骤。 否则,请单击 转至配置 并继续执行下一步。
选择 Cloud Object Storage 服务,然后单击 下一步。
选择 Master Data Management 项目,接受配置资产的缺省名称,然后单击 下一步。
选择现有目录,选中 Enfoce 数据保护规则 选项,然后单击 下一步。
接受缺省工作流程配置名称,然后单击 完成。
单击 继续配置 以完成设置。
单击从数据资产开始。
单击 添加数据。
在项目中插入所有三个数据资产:
选择 项目 选项卡。
选择所有三个 csv 文件:CampaignProspects.csv、Customers.csv 和Experiancc.csv,然后单击插入数据图标()。
单击 添加数据。
将 "人员" 记录类型分配给数据资产。 "记录类型" 提供有关资产包含的数据类型的信息。 每个资产都需要具有分配的记录类型,以便 IBM Match 360 可以找到最适合数据的模型部分。
选中三个资产 ( Campaign Prospects.csv, Customers.csv和 Experiancc.csv) 的复选框,然后单击 设置资产属性。
在选择数据资产类型下拉列表中,选择人员数据资产类型。
单击保存。
检查您的进度
下图显示了添加到主数据的资产。 现在,您已设置主数据并添加了三个数据资产,您已准备好开始映射数据资产属性。
任务 3: 映射数据资产属性
To preview this task, watch the video beginning at 03:22.
要使 IBM Match 360 与所有数据匹配,必须指定将每个数据集的哪些列映射到 IBM Match 360所理解的特定属性。 执行以下步骤以映射数据资产属性。
单击 "映射"选项卡,然后单击 "得到",开始将数据资产的列映射到相应的属性。
在资产列表面板中,选择活动Prospects.csv。
在侧面板中,单击个人资料数据。 剖析数据是将数据列自动映射到IBM Match 360数据模型属性的先决条件。 概要分析需要 2-5 分钟。 数据剖析完成后会显示 "剖析完成"消息。
剖析完成后,单击自动映射资产,即可自动映射数据列。
请参阅表 1:广告系列Prospects.csv映射,手动映射表中所有状态为未映射或映射不正确的列。 要将列映射到属性,可以按照示例:映射现有属性。 要排除列,可以按照示例操作:从映射中排除列。
当资产中所有列的状态都是"已映射"、"自动映射"或 "排除"时,就会出现 "映射下一个数据资产"选项。
对Customers.csv和Experiancc.csv资产重复步骤 3-5。 按照 "表 2:建议的 "Customers.csv映射和 "表 3:建议的 "Experiancc.csv映射中的建议,使用相应的表格将这些数据资产的列映射到 "IBM和 "Match 360数据模型中。 请参阅说明如何手动映射各个属性的示例。 您可以将列映射到现有属性,也可以将列排除在映射之外。
示例 1: 映射现有属性
To preview this task, watch the video beginning at 04:07.
此示例说明如何将 Campaign Prospects.csv 数据资产中的 legal_name.full_name 列映射到现有属性 legal_name.full_name -法定名称-全名。 IBM Match 360 提供了一些通常与客户记录关联的属性,您可以选择将数据集中的列映射到这些记录。
单击列 legal_name.full_name。
从 " 映射目标 " 面板中,在搜索字段中输入
Legal name - Full name
。从列表中选择法律名称 - 全名。 该列显示为 Mapped 和 Mapped to: Legal name-Full name。
您可以重复这些步骤以将数据资产的其他列映射到先前由 IBM Match 360创建或提供的现有属性。
示例 2: 从映射中排除列
To preview this task, watch the video beginning at 05:15.
此示例说明如何从数据资产映射中排除列。 如果列在匹配过程中对 IBM Match 360 无用,或者您不希望在匹配的数据输出中包含这些列,那么可以从映射中排除这些列。
单击名为 源的列。
切换 "排除列"复选框。 该列显示为 已排除。
您可以重复这些步骤以排除数据资产的其他列。
表 1. Campaign Prospects.csv 建议映射
列 | 目标 | 方法 |
---|---|---|
源 | 从映射中排除此列 | 从映射中排除列 |
标识 | 从映射中排除此列 | 从映射中排除列 |
birth_date.value | 出生日期 | 映射现有属性 |
gender.value | 性别 | 映射现有属性 |
legal_name.full_name | Legal Name - Full name | 映射现有属性 |
mobile_telephone.phone_number | Mobile telephone - Phone number | 映射现有属性 |
personal_email.email_id | Personal email - Email address | 映射现有属性 |
商机质量 | 从映射中排除此列 | 从映射中排除列 |
表 2. Customers.csv 建议的映射
列 | 目标 | 方法 |
---|---|---|
客户号 | 从映射中排除此列 | 从映射中排除列 |
名称 | Legal Name - Full name | 映射现有属性 |
国家或地区 | 从映射中排除此列 | 从映射中排除列 |
街道地址 | Primary residence - Address line 1 | 映射现有属性 |
城市 | Primary residence - City | 映射现有属性 |
州 | Primary residence - State/Province value | 映射现有属性 |
ZIP_CODE | Primary residence - Postal code | 映射现有属性 |
EMAIL_ADDRESS | Personal email - Email address | 映射现有属性 |
PHONE_NUMBER | Home telephone - Phone number | 映射现有属性 |
GENDER | 性别 | 映射现有属性 |
CREDITCARD_NUMBER | 从映射中排除此列 | 从映射中排除列 |
表 3。 Experiancc.csv 建议映射
列 | 目标 | 方法 |
---|---|---|
源 | 从映射中排除此列 | 从映射中排除列 |
体验标识 | 从映射中排除此列 | 从映射中排除此列 |
birth_date.value | 出生日期 | 映射现有属性 |
gender.value | 性别 | 映射现有属性 |
home_telephone.phone_number | Home telephone - Phone number | 映射现有属性 |
legal_name.given_name | Legal name - Given name | 映射现有属性 |
legal_name.last_name | Legal name - Last name | 映射现有属性 |
mobile_telephone.phone_number | Mobile telephone - Phone number | 映射现有属性 |
personal_email.email_id | Personal email - Email address | 映射现有属性 |
primary_residence.address_line1 | Primary residence - Address line 1 | 映射现有属性 |
primary_residence.address_line2 | 主要住所-地址行 2 | 映射现有属性 |
primary_residence.city | Primary residence - City | 映射现有属性 |
primary_residence.province_state | 从映射中排除此列 | 从映射中排除列 |
primary_residence.zip_postal_code | Primary residence - Postal code | 映射现有属性 |
信用分数 | 从映射中排除此列 | 从映射中排除列 |
CREDITCARD_NUMBER | 从映射中排除此列 | 从映射中排除列 |
检查您的进度
下图显示了所有映射的数据资产。 现在,您已映射所有三个数据资产的属性,可以发布数据模型并运行匹配。
任务 4: 发布数据模型并运行匹配
任务4a:发布数据模型和所有数据
To preview this task, watch the video beginning at 05:51.
将数据资产中的所有列映射到属性之后,将创建数据模型。 IBM Match 360 使用已发布的数据模型来解析来自所有数据源的单个实体。 执行以下步骤以发布数据模型。
映射最后一个数据集的最后一列后,系统会提示您一些选项。 单击发布模型。 或者,您也可以稍后使用 "发布模型图标 "发布模型。 完成映射三个数据资产中的所有列之后,将显示此选项。 发布模型最多需要 1 分钟。 成功发布数据模型时,您将收到通知。
单击发布数据图标 ",然后单击发布数据,根据映射将映射数据资产加载到IBM Match 360数据模型中。 资产状态从 发布数据 更改为 准备匹配。 数据需要 5-10 分钟才能装入到服务中。
检查您的进度
下图显示了列示为已装入到服务中的数据资产,指示已成功发布数据模型。 接下来,您可以运行匹配。
任务4b:完成匹配设置并运行匹配
To preview this task, watch the video beginning at 06:23.
IBM Match 360 使用已发布的数据模型将数据源的所有记录整合到单个实体中,以创建具有更完整记录的数据资产。 执行以下步骤以运行匹配:
从主数据菜单 ",选择匹配设置"。
选择人员实体类型,自定义记录的匹配方式。
单击 "匹配设置"选项卡,然后单击 "属性选择"屏幕上的 "得到"。 查看 "属性选择"、"记录选择"、"算法调整"和"属性组成"页面的设置。 对于本教程,您可以接受已选择的缺省属性。 在这里,您可以选择有助于区分记录的属性,例如出生日期,电子邮件地址或电话号码,以帮助匹配算法。
单击匹配结果选项卡,然后单击运行匹配。 当匹配过程完成并显示匹配结果时,您将收到通知。
检查您的进度
下图显示了运行匹配后的结果。 现在,您已发布数据模型并运行匹配,您已准备好将匹配的数据发布到目录。
任务 5: 将匹配的数据发布到目录
To preview this task, watch the video beginning at 06:54.
任务5a:为IBM Match 360创建连接资产
要访问项目中的匹配数据,需要创建与 IBM Match 360的连接资产。 IBM Match 360 连接资产将与 IBM Match 360 服务匹配的数据连接到已连接的数据资产。 执行以下步骤以创建连接资产。
从导航菜单",选择项目 > 查看所有项目
选择 Master Data Management 样本项目。
在 资产选项卡上,单击 新资产 > 连接到数据源。
选择 IBM Match 360 连接器,然后单击 下一步。
输入连接资产名称
Match 360 Connection
。检索 IBM Match 360 with Watson 服务实例的 CRN:
从IBM Cloud控制台资源列表页面,单击分析展开服务实例列表。
在 产品 列中,单击 IBM Match 360 with Watson。
在打开的详细信息面板中,单击所选 IBM Match 360 with Watson 服务的 CRN 的 复制到剪贴板 图标。
在 连接详细信息中,粘贴与 IBM Match 360 with Watson 服务实例对应的 CRN。
创建 IBM Match 360 API 密钥:
从IBM Cloud控制台,单击管理 > 访问 (IAM)。
单击 API 密钥 页面。
单击创建 IBM Cloud API 键。 如果您有任何现有 API 密钥,那么该按钮可能标记为 创建。
输入名称和描述。
单击创建。
复制 API 密钥。
下载 API 密钥以供将来使用。
使用您创建的 API 密钥填写 API 密钥 字段。
单击创建。
如果要求您确认要在不设置位置和主权的情况下创建连接,请单击 创建。
检查您的进度
下图显示了 Match 360 连接资产。 现在,您可以从此连接创建已连接的数据资产。
任务5b:导入连接的数据资产
要预览此任务,请观看从 8:32 开始的视频。
现在,使用 IBM Match 360 连接从 IBM Match 360创建合并数据的新的已连接数据资产。 执行以下步骤以创建已连接的数据资产。
单击 导入资产。
在 " 导入资产 " 页面上,选择 已连接的数据。
选择 Match 360 连接> 记录> 人员> person_entity。
单击导入。
检查您的进度
下图显示了已连接的数据资产。 现在,您为已合并的匹配数据创建了已连接的数据资产,可以将该资产发布到目录。
任务5c:将连接的数据资产发布到目录中
要预览此任务,请观看从 8:55 开始的视频。
执行以下步骤以将合并的匹配数据发布到该目录。
在 Master Data Management 项目中,验证您是否位于 资产 选项卡上。
单击连接数据资产 person_entity 的 Overflow 菜单 并选择 Publish to catalog。
从列表中选择 抵押贷款审批目录 (或您的目录名称) ,然后单击 下一步。
(可选) 选择 发布目录后转至目录选项,然后单击 下一步。
复审资产,然后单击 发布。
在目录中查看和更新资产:
如果您不在目录中,请从导航菜单"选择目录 > 查看所有目录、 点击发布连接数据资产的目录。
单击与person_entity相连的数据资产。
单击编辑名称图标 "。 键入连接数据资产的名称 "
Golden Bank 360 View
,然后单击 "应用"。单击资产选项卡以预览数据。
检查您的进度
下图显示了目录中的数据资产。
作为 Golden Bank 的数据工程师,您成功使用 IBM Match 360 为客户的 360 度视图设置,映射和建模数据。 然后,您将匹配数据的完整 360 度视图发布到目录中,以供组织中的其他人访问。
任务 6: 预览匹配的数据
要预览此任务,请观看从 09:28 开始的视频。
现在,您已将模型或数据更改发布到 IBM Match 360,设置匹配的参数并运行匹配,您可以使用主数据资源管理器来查询匹配的数据。 主数据资源管理器支持您查找,查看,比较和编辑匹配结果。 现在,作为 Golden Bank 的数据分析人员,您必须分析,探索和验证 IBM Match 360 结果,以确定并选择最符合条件的客户来确定营销活动商品的目标。 遵循以下步骤来浏览和调整匹配的数据。
从导航菜单 ,选择数据 > 主数据。
从主数据菜单 ",选择搜索"。
在搜索栏中,输入
Branden Banks
,然后按 Enter 键以添加 Branden Banks 作为搜索条件。 对于此搜索查询,将显示 Branden Banks 的 2 实体。 第一列中的数字 2 指示构成此实体的两个源记录和第一列中的数字 1 表示一个源记录构成另一个实体。扩大这两个实体。 你可以看到,布兰登银行的这些单独实体很可能只有一个人。 要将这些实体连接到单个实体中,可以调整匹配算法。
检查您的进度
下图显示了主数据资源管理器中的搜索结果。 接下来,您可以调整匹配算法并再次运行匹配。
任务 7: 调整匹配算法并运行匹配
To preview this task, watch the video beginning at 10:09.
在探索匹配的数据后,有时需要对匹配算法进行微调,再运行匹配,以获得更好的结果。
从主数据菜单 ",选择匹配设置"。
选择人员实体类型,自定义记录的匹配方式。
单击 "匹配设置"选项卡,然后单击 "属性选择"屏幕上的 "得到"。
单击算法调整页面。
单击匹配结果选项卡,然后单击运行匹配。 当匹配过程完成并显示匹配结果时,您将收到通知。
单击 主数据资源管理器 下拉列表,然后从菜单中选择 匹配设置 。
单击 匹配设置 选项卡,然后选择 算法调整 页面。
切换已启用的文书范围字段。
在办事员审查阈值字段中输入 "
10
。 得分低于该临界值则不能进行比赛。在自动链接阈值字段中输入 "
20
。 将阈值降低到 20 会导致源中记录之间的总体匹配程度更高。 介于文书和自动链接阈值之间的分数会产生文书审查任务。单击 应用阈值> 下一步> 运行匹配 以运行与已调整算法的匹配。
单击 匹配结果 选项卡。 匹配完成时将显示结果。
检查您的进度
下图显示了匹配设置的结果。 接下来,您可以再次查看匹配的数据,以了解微调如何更改结果。
任务 8: 获取有关匹配结果的洞察
To preview this task, watch the video beginning at 10:45.
您可以返回到主数据资源管理器,以查看算法调整如何更改匹配结果。
从主数据菜单 ",选择搜索"。
在搜索栏中,输入
Branden Banks
,然后按 Enter 键以添加 Branden Banks 作为搜索条件。 与所显示实体关联的数字 3 表示在将实体 Branden Banks 拆分为多个实体之前,有三个记录组成该实体。展开实体第一列中的行以查看记录。 您可以看到与此实体匹配的三个记录。
检查您的进度
下图显示了主数据资源管理器中的搜索结果。 接下来,您可以通过可视化匹配结果来获取洞察。
任务 9: 将实体的记录可视化
To preview this task, watch the video beginning at 11:11.
您还可以将调整后的匹配结果可视化为节点,以获取洞察。
单击 显示图形 以查看哪些记录正在向查询的实体添加内容。
单击连接到人员实体的任何节点以查看与其关联的详细信息。 从此处,您可以直观显示并手动修改与查询中的每个实体相关联的记录,以根据需要进行更正。
检查您的进度
下图以图形形式显示了搜索结果。
作为数据分析人员,您分析,探索和验证了 IBM Match 360 结果,以确定并选择市场营销活动商品的最佳合格客户。
清除(可选)
如果要重新学习 Master Data Management 用例中的教程,请删除以下工件。
工件 | 如何删除 |
---|---|
抵押贷款审批目录 | 删除目录 |
Master Data Management 样本项目 | 删除项目 |
后续步骤
了解更多信息
父主题: 用例教程