0 / 0
Go back to the English version of the documentation
监测浓缩工作的运行
Last updated: 2024年12月05日
监测浓缩工作的运行

查看元数据丰富运行的详细信息,或通过查看运行指标监控正在运行的作业。

您可以查看任何元数据浓缩任务运行的详细信息。 运行指标可用于在Cloud Pak for Data 5.1 中进行的元数据丰富化任务的任何运行。

查看作业运行详情

一般来说,您可以从项目中的 "作业"页面访问任何作业运行详情:

  1. 您可以从该页面选择要查看运行信息和详细信息的作业。 如果您有很多工作,可以对视图进行范围划分:

    • 具有活动运行的作业
    • 活动运行
    • 具有已完成的运行的作业
    • 完成的运行

    您可以应用更多筛选器,进一步缩小所选视图范围的搜索结果范围。

  2. 单击任务名称。 作业详情页面显示已完成和失败的运行次数,以及配置的作业计划。

  3. 选择特定运行并查看运行详情。 任务运行的运行详情如下:

    • 工作运行状态
    • 持续时间、开始和结束时间
    • 谁开始跑步
    • 相关工作的链接
    • 相关元数据的链接
    • 有关浓缩配置的基本信息:
      • 所选的增益选项
      • 用于数据类别、术语和分类分配的类别数
      • 使用的抽样方法
      • 用于学期分配的算法

    在这里,您还可以根据任何配置的作业执行窗口暂停和恢复作业运行。

根据任务类型,运行指标日志选项卡上会提供更多有关实际运行的信息。

您还可以从元数据丰富资产中访问最近运行的元数据丰富任务的详细信息。 您可以单击信息面板中 "任务详情"部分的 "查看指标"链接或资产详情面板中的 "任务运行详情"链接。

查看运行指标

为按配置运行或为高级数据剖析运行的元数据丰富作业提供运行指标。 在 "作业运行详情 "中的 "运行指标"选项卡上,您可以监控元数据丰富作业的活动运行进度,或检查已完成作业运行的状态信息。

运行指标仅适用于 2025 年 11 月 21 日之后运行的作业。 对于较早的作业运行,可以查看作业运行日志。

摘要部分显示浓缩的总体进展情况:

  • 被充实的资产总数。
  • 已完成、进行中和失败资产的数量。 对于故障资产,将提供故障详情链接。
  • 进行增殖的资产百分比。

分析关系任务指标的计算方法与其他任务指标不同。 因此,它们没有反映在摘要中。

目标"部分按处理顺序显示各个增益选项的进度。 数据质量分析(如果选择)作为剖析的一部分运行,不会单独显示。

除了每个浓缩任务整体流程的进度条外,您还可以查看任务处理过程中有多少数据资产处于何种状态。 除 "分析关系"任务外,数据资产都有这些状态:

  • In progress:资产正在处理或等待处理。
  • Completed:资产的充实任务已成功完成。
  • Skipped:由于先决条件丰富任务失败,资产未被处理。 例如,学期分配可能需要根据所选算法进行剖析。 在剖析过程中,资产不能具有这种状态,因为剖析通常是丰富过程的第一步。
  • Failed:该资产的充实任务失败。 如果计数不为零,可以点击数字查看故障详情。

对于 "丰富关系分析"目标,显示了任务总数、已完成任务数和出错任务数。 分析任务的总数取决于所分析数据资产的数量。 每 1,000 个数据资产就会创建一个分析任务,用于计算潜在关系。

对于暂停的增量,仪表板上的指标在暂停期间会被隐藏。 恢复浓缩时,初始指标反映的是暂停浓缩时的浓缩状态。 当作业运行暂停时,日志可能会提供比指标仪表板更详细的实际状态信息。

对于取消的浓缩,指标反映的是取消运行时的浓缩状态。 实际充实结果可能与显示的指标不同,因为状态为 "in progress的资产在任务取消后可能仍在充实。 正在进行中的资产的充实是取消还是完成,取决于资产的内部处理状态。 日志提供的实际状态信息可能比指标仪表板更详细。

了解工作运行日志

为所有类型的元数据丰富工作提供日志。 要查看任务运行的日志,请切换到任务运行详细信息页面上的日志选项卡。 日志会显示任务类型、任务运行 ID 以及丰富任务的详细信息。

  • 条目 "运行完整的元数据丰富工作或 "运行 "德尔塔 "元数据浓缩任务表示使用配置的丰富选项运行的基本元数据丰富任务。 完全是指在范围内的所有数据资产或手动选择的一组数据资产上运行浓缩。 Delta表示只丰富上次丰富运行后添加或修改的数据资产,或上次丰富失败或取消的数据资产。 重运行的数据范围决定了是运行完全元数据富集还是 delta 元数据富集。

    对于元数据浓缩任务,会显示与度量仪表板类似的信息,如资产摘要和每个浓缩任务的统计信息。 此外,如果术语分配是增强功能的一部分,还包括所使用术语分配模式的一些细节。

    您可以暂停和恢复该作业类型的运行。 然后,任务运行日志会包含一个显示暂停开始和结束时间的条目。 即使作业运行暂停了多次,日志中也只会列出最后一次暂停。

  • 高级剖析元数据丰富作业运行条目表示生成更准确剖析结果的作业。 在度量仪表板中,此类作业运行显示为配置文件数据任务。

  • 键值分析任务运行条目表示键值或关系分析任务。 分析类型由其中一个条目标识:

    • 主键检测任务<taskID>) 类型为 "pk_deep
    • 外键关系检测任务<taskID>) 的类型为'fk_deep'
    • 重叠键检测任务<taskID>)的 "重叠 "类型

    此任务类型不提供运行指标。

  • 元数据发布任务运行条目表示发布任务。

了解更多信息

家长主题: 管理丰富的工作

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more