メタデータ・エンリッチメント実行の詳細を確認したり、実行メトリクスを表示してアクティブなジョブ実行を監視したりできます。
メタデータ・エンリッチメントのジョブ実行の詳細を確認することができます。 実行メトリクスは、Cloud Pak for Data 5.11で発生したメタデータ・エンリッチメント・ジョブのすべての実行で利用できます。
ジョブ実行の詳細の表示
一般的に、プロジェクトのジョブページからジョブ実行の詳細にアクセスすることができます:
このページから、ラン情報や詳細を確認したいジョブを選択することができます。 多くの仕事を抱えているのであれば、視野を広げることができる:
- アクティブな実行を含むジョブ
- アクティブな実行
- 完了した実行を含むジョブ
- 完了した実行
さらにフィルタを適用することで、選択したビュースコープの検索結果をさらに絞り込むことができます。
ジョブ名をクリックします。 ジョブの詳細ページには、完了した実行回数と失敗した実行回数、および設定されたジョブスケジュールが表示されます。
特定のランを選択し、ランの詳細を確認します。 ジョブ実行の詳細は以下の通り:
- ジョブの実行状況
- 期間、開始時間、終了時間
- 誰が走り始めたのか
- 関連する仕事へのリンク
- 関連するメタデータ・エンリッチメントへのリンク
- エンリッチメント・コンフィギュレーションに関する基本情報:
- 選択された強化オプション
- データクラス、用語、および分類の割り当てに使用するカテゴリの数
- サンプリング方法
- 用語割り当てに使用されるアルゴリズム
ここでは、設定されたジョブの実行ウィンドウに従って、ジョブの実行を一時停止したり再開したりすることもできます。
ジョブのタイプによっては、実際の実行に関する詳細情報がRun metricsおよびLogタブに表示されます。
また、メタデータ・エンリッチメント資産から、最近実行されたメタデータ・エンリッチメント・ジョブの詳細にアクセスすることもできます。 情報パネルのジョブ詳細セクションにある「View metrics」リンク、または資産詳細パネルにある「Details of job run」リンクをクリックできます。
ラン・メトリクスの表示
実行メトリクスは、設定どおりに実行されるメタデータ・エンリッチメント・ジョブ、または高度なデータ・プロファイリングのために実行されるメタデータ・エンリッチメント・ジョブに対して提供されます。 ジョブ実行の詳細の[Run metrics]タブでは、メタデータ・エンリッチメント・ジョブのアクティブな実行の進行状況を監視したり、完了したジョブ実行のステータス情報を確認したりできます。
実行メトリクスは、2025年11月21日以降に実行されたジョブにのみ利用可能です。 古いジョブの実行については、ジョブの実行ログを確認できます。
サマリー・セクションは、エンリッチメントの全体的な進捗状況を示す:
- 豊かになった資産の総数。
- 完了した資産、進行中の資産、失敗した資産の数。 失敗したアセットについては、失敗の詳細へのリンクが提供される。
- エンリッチメントが行われる資産の割合。
関係の分析」タスクのメトリクスは、他のタスクのメトリクスとは計算方法が異なります。 そのため、要約には反映されていない。
目的」セクションには、個々のエンリッチメント・オプションの進行状況が、処理される順番に表示される。 データ品質分析が選択された場合は、プロファイリングの一部として実行され、個別に表示されない。
各エンリッチメントタスクの全体的なプロセスのプログレスバーに加えて、タスクの処理中にどのステータスにあるデータ資産がいくつあるかを確認できます。 関係の分析タスクを除き、データ資産はこれらのステータスを持ちます:
In progress
: 資産は処理中か処理待ちです。Completed
: エンリッチメントタスクが正常に完了したアセット。Skipped
: 前提条件のエンリッチメントタスクが失敗したため、アセットが処理されませんでした。 例えば、用語の割り当てでは、選択したアルゴリズムによってプロファイリングが必要になるかもしれない。 通常、プロファイリングはエンリッチメント・プロセスの最初のステップであるため、プロファイリング中、アセットにこのステータスを持たせることはできない。Failed
: アセットのエンリッチメントタスクが失敗しました。 カウントがゼロでない場合は、数字をクリックして失敗の詳細を見ることができます。
人間関係を分析するエンリッチメント目標については、タスクの総数、完了したタスクの数、エラーのあったタスクの数が示されている。 分析タスクの総数は、分析するデータ資産の数に依存する。 1,000のデータ資産ごとに、潜在的な関係を計算するための分析タスクが作成される。
一時停止されたエンリッチメントでは、ダッシュボードのメトリクスは一時停止の間非表示になります。 エンリッチメントを再開すると、最初のメトリクスは、エンリッチメントを一時停止した時点のエンリッチメントのステータスを反映する。 ジョブの実行が一時停止されている間、ログはメトリクス・ダッシュボードよりも実際のステータスに関する詳細な情報を提供する場合があります。
キャンセルされた濃縮については、メトリクスは、ランがキャンセルされた時点の濃縮ステータスを反映します。 ステータスが「in progress
」の資産のエンリッチメントは、ジョブがキャンセルされた後でも完了する可能性があるため、実際のエンリッチメント結果は表示されたメトリクスと異なる場合があります。 進行中の資産の濃縮が中止されるか完了するかは、資産の内部処理状況による。 ログは、メトリックス・ダッシュボードよりも実際のステータスについてより詳細な情報を提供するかもしれない。
ジョブの実行ログを理解する
ログは、すべてのタイプのメタデータ・エンリッチメント・ジョブに提供される。 ジョブ実行のログを表示するには、ジョブ実行詳細ページのログタブに切り替えます。 ログには、ジョブの種類、ジョブの実行ID、およびエンリッチメントタスクに応じた詳細が表示されます。
エントリFull metadata enrichment job runまたはDelta metadata enrichment job runは、設定されたエンリッチメントオプションで実行される基本的なメタデータエンリッチメントジョブを示す。 フルとは、スコープ内のすべてのデータ資産、または手動で選択したデータ資産のセットに対してエンリッチメントが実行されることを意味します。 デルタとは、エンリッチメントの最終実行後に追加または変更された、あるいは前回のエンリッチメントが失敗またはキャンセルされたデータ資産のみがエンリッチされることを意味する。 再実行のデータスコープは、完全なメタデータエンリッチメントを実行するか、デルタメタデータエンリッチメントを実行するかを決定する。
メタデータ・エンリッチメント・ジョブでは、アセット・サマリーや各エンリッチメント・タスクの統計など、メトリクス・ダッシュボードと同様の情報が表示されます。 さらに、用語割り当てがエンリッチメントの一部である場合は、使用される用語割り当てモデルについての詳細も記載される。
このジョブ・タイプの実行を一時停止したり、再開したりすることができる。 ジョブの実行ログには、一時停止の開始時刻と終了時刻を示すエントリーが含まれる。 ジョブの実行が何度も一時停止された場合でも、ログには最後の一時停止のみが記録されます。
Advanced profiling metadata enrichment job runという項目は、より正確なプロファイリング結果を生成するためのジョブを示す。 メトリクス・ダッシュボードでは、このタイプのジョブ実行はプロファイル・データ・タスクとして表示されます。
Key analysis job run(キー分析ジョブの実行)という項目は、キー分析またはリレーション分析 のジョブを示す。 分析の種類は、これらの項目のいずれかによって特定される:
- pk_deep' 型の主キー検出タスク<taskID>)
- fk_deep' 型の外部キー関係検出タスク<taskID>)
- 'overlap'タイプの重複キー検出タスク<taskID>)
このジョブ・タイプでは、実行メトリクスは提供されません。
Metadata publish job runという項目は、パブリッシュ・ジョブを示しています。
もっと見る
親のトピック 充実した仕事の管理