翻訳が最新ではありません
使い慣れたスプレッドシート環境を使用して、単一のメタデータ・エンリッチメントの範囲内のデータ資産のデータ・クラスおよび用語の割り当てを確認および管理したいと考えています。
要件および制約事項
スプレッドシートでのデータ・クラスおよび用語の割り当ての管理には、以下の要件および制限があります。
前提条件の構成
「メタデータの確認 (Review metadata)」 Office アドインを組織にデプロイする必要があり、アドインに付属の Microsoft Excel ワークブック・テンプレートのコピーを用意する必要があります。
Microsoft の管理者は、IBM Knowledge Catalog サンプル GitHub リポジトリの manifest.xml
ファイルと Review metadata - IBM Knowledge Catalog.xlsx
ワークブックテンプレートを metadata-enrichment
フォルダからダウンロードできます:https://github.com/IBM/knowledge-catalog-samples にあります
manifest.xml
の調整手順は、マニフェスト・ファイルおよび Excel テンプレートに付属する README ファイルに記載されています。
管理者は、Microsoft の資料「 Deploy and publish Office Add-ins」の説明に従って、アドインをデプロイして公開する必要があります。
「メタデータの確認」 Excel アドインをアクティブ化する必要があります。 その方法については、ご使用の Excel のバージョンに該当する資料を確認してください。
制限
ワークブックとアドインの操作を開始する前に、 Microsoft Excel アドインの問題の情報を確認してください。
ワークブックの概観
ワークブックは、以下の 5 つの保護されたシートで構成されます。
シート | 内容 |
---|---|
データ資産 | 列: 「接続」 「データ・パス」 「データ資産」 「列」 「タイプ」 「説明」 「割り当て済み/推奨されたデータ・クラス」 「データ・クラス」 「割り当て済み/推奨されたビジネス用語」 「ビジネス用語」列。 デフォルトでは、3 つの列が用意されています。 さらに列を追加できます。 「 割り当ての確認と更新」を参照してください。 |
ビジネス用語 | 列: Name Abbr。 用語に定義されている省略形のリスト。 カテゴリー・パス 識別名。 同じ名前の用語が複数存在する場合、用語を区別するために、名前とカテゴリー・パスがここにリストされます。 説明 2 次カテゴリー タグ 分類 有効開始 有効終了 |
データ・クラス | 列: 名前 カテゴリー・パス 識別名。 同じ名前のデータ・クラスが複数存在する場合、データ・クラスを区別するために、名前とカテゴリー・パスがここにリストされます。 説明 2 次カテゴリー タグ 分類 有効開始 有効終了 |
カテゴリー | 列: 「名前」 「パス」 「説明」 「タグ」 分類 |
Knowledge Catalog | 「ダウンロード情報」 「アップロード情報」 |
Cloud Pak for Data からのデータの取得
データをワークブックにロードするには、以下のようにします。
作業するメタデータ・エンリッチメントごとに、ワークブック・テンプレートのコピーを作成します。 各コピーに分かりやすい名前を付けます。例えば、プロジェクト名とメタデータ・エンリッチメント名を含めます。 これにより、データが属する場所を簡単に識別できます。
ブックを開きます。 アドインを既に有効化している場合は、Excelのホームリボンに[メタデータのレビュー]ボタンが表示されます。このボタンが表示されていない場合は、お使いのExcelのバージョンに適用される手順に従って、今すぐアドインを有効化してください。
アドイン・タスク・ペインを開くには、 「メタデータの確認」 ボタンをクリックします。
Cloud Pak for Data の資格情報を使用してログインします。
ガバナンス成果物およびデータ資産を取得します。 この情報は、2 つの別個のステップでダウンロードできます。 ただし、データ資産をダウンロードする前に、ガバナンス成果物をダウンロードする必要があります。 そうしないと、割り当てを表示できません。
ガバナンス成果物の取得
Cloud Pak for Dataで定義されているすべてのデータクラスとビジネス用語に関する情報を、ワークブックのそれぞれのシートに追加します。 また、データ・クラスおよび用語が属するカテゴリーに関する情報も追加します。
データ資産の取得
プロジェクトとメタデータ・エンリッチメントを選択し、選択したメタデータ・エンリッチメントの範囲内にあるデータ資産をダウンロードします。 新しく作成されたプロジェクトがプロジェクト・リストに表示されない場合は、アドインを再ロードしてください。
重要: 潜在的なデータ不一致を回避するために、以前に作業したメタデータ・エンリッチメントからデータを取得する場合でも、データ取得には常に新しいワークブックを使用してください。
情報が正常に取得されると、 Knowledge Catalog シートに以下の情報が取り込まれます。
- Cloud Pak for Data のホスト名
- データのロード元のプロジェクトおよびメタデータ・エンリッチメントの名前。 スプレッドシートには、初期取得時の表示名が常に反映されます。 IBM Knowledge Catalogでプロジェクト名やメタデータ・エンリッチメントが変更されても更新されません。 ただし、これは変更不可能なリソース ID を使用して行われるため、アップロード時の更新には影響しません。
- ガバナンス成果物とデータ資産がダウンロードされた日付と時刻
また、アドイン・タスク・ペインでアップロード・オプションが有効になります。
「ビジネス用語」、 「データ・クラス」、および 「カテゴリー」 シートには、 ワークブックの外観にリストされている情報が含まれています。
「データ資産」 シートには、データ資産のアルファベット順リストと、それに続くすべての列のアルファベット順リストが含まれています。 「データ資産」 シートの列には、以下のデータが取り込まれます。
シート列 | 編集可能 | データ資産 | 資産列 |
---|---|---|---|
接続 | いいえ | 接続名 | 接続名 |
データ・パス | いいえ | スキーマ | スキーマ |
データ資産 | いいえ | 資産名 | 資産名 |
列 (Column) | いいえ | 列名 | |
タイプ | いいえ | 「データ・セット」 に設定します。 | 「フィールド」 に設定します。 |
説明 | はい | データ資産に使用できる可能性のある説明 | 資産の列に表示される可能性のある説明 |
割り当て済み/推奨データ・クラス | いいえ | 割り当て済みデータ・クラスと推奨データ・クラス 割り当て済みデータ・クラスも 「データ・クラス」 列にリストされます。 |
割り当て済みデータ・クラスと推奨データ・クラス 割り当て済みデータ・クラスも 「データ・クラス」 列にリストされます。 |
データ・クラス | データ資産の場合は「いいえ」 資産列の場合は「はい」 |
割り当てられているデータ・クラス | 割り当てられているデータ・クラス |
割り当て済み/提案済みビジネス用語 | いいえ | 割り当てられた用語と提案された用語 割り当てられた用語も、別個の 「ビジネス用語」 列にリストされます。 |
割り当てられた用語と提案された用語 割り当てられた用語も、別個の 「ビジネス用語」 列にリストされます。 |
ビジネス用語 列の数はさまざまです。 デフォルトは 3 列です。 データ資産または資産列にさらに用語が割り当てられている場合は、必要に応じて列が追加されます。 必要に応じて、さらに列を追加できます。 「 割り当ての確認と更新」を参照してください。 |
はい | 割り当てる条項 | 割り当てる条項 |
割り当ての確認および更新
メタデータを確認して更新するには、以下のようにします。
「データ・クラス」 列と 「ビジネス用語」 列にチェック・マークを付けます。
正しい割り当ては未変更のままにします。 誤った割り当てを置換または削除します。 ビジネス用語の場合は、必要な数だけ追加できます。 各用語は別々の列になければなりません。 デフォルトでは、ビジネス用語のシートには 3 つの列が含まれています。 以下のように、列を追加できます。
- 「データ資産」 シートの保護を解除します。
- 最後の 「ビジネス用語」 列を選択します。
- その列の任意の場所を右クリックして、 「挿入」を選択します。
- オプション: 列見出し 「ビジネス用語」を追加します。
- シートをもう一度保護します。
これで、この新しい列を使用してビジネス用語を割り当てることができます。
レビュー済みの結果のアップロード
確認が完了したら、更新したメタデータを Cloud Pak for Dataにアップロードします。 アップロードを開始する前にブックを保存する必要はありません。
アップロードしたデータによって、プロジェクト内のエンリッチメント結果が上書きされます。 以前に割り当てられたデータ・クラスはすべて未割り当てとなり、提案としてマークされる。 その後、データクラスとビジネスタームの割り当てがスプレッドシートで指定されたとおりに更新される。 スプレッドシート内の説明は、プロジェクト内の資産および列の説明を上書きします。 すべての列およびアセットにレビュー済みのマークが付けられます。
もっと見る
親トピック: メタデータ・エンリッチの管理