0 / 0
資料の 英語版 に戻る
メタデータ・インポートの作成
最終更新: 2024年7月05日
メタデータ・インポートの作成

テクニカル・メタデータをインポートして、データ資産をプロジェクトまたはカタログに追加できます。 プロジェクトでは、データをカタログに公開する前に、データを準備して分析することができます。

データをカタログに公開する前にデータを準備して分析するために、メタデータをデータ資産としてプロジェクトにインポートします。 メタデータ・エンリッチを実行して、そのようなデータ資産のプロファイルを作成し、データ品質を分析し、ビジネス・コンテキストを提供する用語を割り当てます。 より詳細な品質分析を行うには、データ資産に対してデータ品質ルールを実行します。 追加の準備なしでデータを共有する準備ができている場合は、データ資産をカタログに直接追加することもできます。

ユーザー・インターフェースの代わりに API を使用して、サポートされる接続のリストを取得したり、メタデータ・インポート資産を作成したりすることができます。 これらの API へのリンクは、 詳細情報 セクションにリストされています。

資産タイプ

外部データ・ソースへの接続からの表またはファイルを表すデータ資産。

注: Microsoft Excel ブックの場合、各シートは別個のデータ資産としてインポートされます。 データ資産名は Excel シートの名前と同じです。

サポートされる接続

サポートされるコネクターMetadata import 列を参照してください。

必要な権限

メタデータのインポートを作成、管理、および実行するには、以下の役割と権限が必要です。

  • プロジェクト内の 「管理者」 または 「エディター」 役割。
  • 資産をインポートまたは公開するカタログ内の 「管理者」 または 「エディター」 役割。
  • インポートするデータ資産のデータ・ソースへの接続、および対応するデータベースに対する SELECT または類似の許可へのアクセス。

概要

ディスカバリー用のメタデータのインポートには、以下のプロセスが含まれます。

  • インポート元のデータ・ソースを識別します。 このデータ・ソースへの接続が既に定義されている場合があります。 それ以外の場合は、このデータ・ソースに接続するための資格情報があることを確認してください。 サポートされる接続のリストについては、 サポートされるコネクターを参照してください。
  • プロジェクトで、メタデータ・インポート資産を作成して、インポートのスコープとターゲット、インポート・ジョブのスケジュールなどのインポート詳細を構成します。
  • 資産をプロジェクトまたはカタログにインポートします。 インポートしたデータ資産にアクセスすると、データがデータ・ソースから動的に取得されます。
  • プロジェクトにインポートしたメタデータを分析してプレビューし、それをカタログに共有します。 各アセットの プロファイル タブから、個々のアセットのプロファイルを一度に 1 つずつ作成できます。 また、複数のデータ資産のプロファイルを並行して作成し、 メタデータ・エンリッチ資産を作成して実行することで、それらのデータ資産にビジネス・コンテキストを追加することもできます。

この短いビデオを視聴して、外部ソースからプロジェクトに資産メタデータをインポートする方法を確認してください。

このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。

メタデータ・インポート資産の作成およびメタデータのインポート

メタデータ・インポート資産と、メタデータをプロジェクトまたはカタログにインポートするためのジョブを作成するには、以下のようにします。

  1. プロジェクトを開き、プロジェクトの資産ページをクリックして新しいアセット > データアセットのメタデータをインポート

  2. メタデータ・インポートの名前を指定します。 オプションで、説明を指定することもできます。

  3. オプション: 検索を簡素化するためにメタデータ・インポート資産に割り当てるタグを選択します。 新規タグを作成するには、タグ名を入力して Enter キーを押します。

  4. インポート・ターゲットを選択します。 作業しているプロジェクトにメタデータをインポートすることも、自分がメンバーになっている任意のカタログにメタデータをインポートすることもできます。

    他のユーザーが作業できるようにカタログに共有する対象の資産を決定する前に、メタデータをプロジェクトにインポートして分析します。 プロジェクトでは、インポートされたデータ資産に対してメタデータ・エンリッチおよびデータ品質ルールを実行できます。

    データ資産の内容を十分に理解している場合は、そのメタデータをカタログに直接インポートしても構いません。

    プロジェクトが機密としてマークされている場合は、プロジェクトにのみインポートでき、カタログにはインポートできません。

  5. メタデータ・インポートのスコープを定義します。

    1. データのソースとして既存の接続資産を選択するか、または 新規接続の作成 および 接続資産の作成をクリックしてください。 サポートされるコネクターにリストされているデータ・ソースからメタデータをインポートできます。

    2. インポートに含めるアイテムを選択し、 「選択」をクリックします。 データ・ソースのサイズと内容によっては、すべての資産をインポートする必要がなく、サブセットを選択してインポートしたい場合があります。 完全なスキーマまたはフォルダーを含めることも、個々の表やファイルにドリルダウンすることもできます。 スキーマまたはフォルダーを選択すると、そのスキーマまたはフォルダーに含まれる項目の数を即時に確認できます。 このようにして、セット全体を含めるのか、またはサブセットのみの方が目的に適しているのかを判別できます。

      名前に特殊文字が含まれているスキーマからデータをインポートすることはできないことに注意してください。

    3. 選択したスコープを確認します。 データ・スコープから資産を直接削除することも、 データ・スコープの編集をクリックしてスコープ全体を再作業することもできます。 データ・スコープの詳細化した後、 次へをクリックしてください。

  6. スケジュールされたインポート・ジョブを実行するかどうかを定義します。 スケジュールを設定しない場合は、メタデータ・インポート資産の保存時にインポートを実行します。 インポートは、いつでも手動で再実行できます。 特定のスケジュールでインポートの実行を選択する場合は、ジョブを実行する日時を定義します。 単一の実行をスケジュールすることも、繰り返し実行をスケジュールすることもできます。 単一の実行をスケジュールすると、ジョブは指定された日時に 1 回だけ実行されます。 繰り返し実行をスケジュールすると、ジョブは 「繰り返し」 セクションに示されているタイム・スタンプで初めて実行されます。

    オプションで、インポート・ジョブの名前を変更します。 デフォルト名は metadata_import_name ジョブです。

    作成したインポート・ジョブには、メタデータ・インポート資産内から、またはプロジェクトの ジョブ ページから後でアクセスできます。 ジョブを参照してください。

  7. オプション。 インポート動作をカスタマイズします。 特定のプロパティーが更新されないようにしたり、再インポートに含まれていない既存の資産を削除したりすることができます。

    再インポート時に更新
    デフォルトでは、アセットが再インポートされると、すべてのアセット・プロパティーが更新されます。 再インポート時にアセット名、アセットの説明、または列の説明を更新しないようにするには、該当するチェック・ボックスをクリアします。
    再インポート時に削除
    デフォルトでは、インポートの再実行時に、ターゲット・プロジェクトまたはカタログから資産は削除されません。 ターゲット・プロジェクトまたはカタログをクリーンアップするために、データ・ソースで使用できなくなった資産、または再インポート時にインポート・スコープから削除された資産を削除することを選択できます。
    インポートから除外
    リレーショナル・データベースで実行するメタデータ・インポートの場合、すべてのタイプのリレーショナル資産をインポートするか、表、ビュー、別名、およびシノニムを除外するかを選択できます。 この 2 つのオプションは相互に排他的です。
    追加プロパティーのインポート
    リレーショナル・データベースで実行するメタデータ・インポートの場合、データベースで定義されている可能性のある主キーと外部キーをインポートするかどうかを選択できます。

    その他のインポート・オプション:

    データ・ソース内の資産の説明を更新または削除しても、資産の変更日は変更されません。 また、インポートされた資産のリストから削除された資産についても、変更日は変更されません。 そのため、このような資産はインクリメンタル・インポートの対象とはなりません。 また、データ・ソースまたはスコープから削除された資産は、増分インポートでは検出されません。 したがって、そのような資産には、 「再インポート時に削除」 設定で指定された 「削除済み」 または削除済みのマークは付けられません。 このような変更が反映されていることを確認するには、増分インポートを無効にして、データ・スコープ内のすべての資産を再インポートします。

    重要: Cloud Pak for Data アカウントにアクセスするデータ・ソースと場所が異なるタイム・ゾーンにある場合、インクリメンタル・インポートが機能しない可能性があります。 データ・ソースのタイム・ゾーンよりも前のタイム・ゾーンで Cloud Pak for Data アカウントにアクセスする場合、メタデータ・インポート・ジョブは、前回のインポートの実行後に追加または変更された資産を検出しない可能性があります。 この場合、インクリメンタル・インポートを無効にして、インポートの再実行時にすべての資産が含まれるようにします。
    増分インポートが機能するためには、 Cloud Pak for Data アカウントのタイム・ゾーンに関係なく、データ・ソースは GMT タイム・ゾーンでなければなりません。
    • データベース・カタログからメタデータを収集
      リレーショナル・データベースで実行するメタデータ・インポートの場合、データベース・カタログからメタデータをインポートすることを選択できます。 したがって、インポートを実行するユーザーは、データベース・カタログにのみアクセスする必要がありますが、実際のデータに対する SELECT 権限は必要ありません。 インポートされた資産のプロファイルを作成したり、メタデータのエンリッチメントで使用したりすることはできません。
  8. メタデータ・インポート構成を確認します。 変更を行うには、タイル上の 「編集」 アイコン 編集アイコン をクリックし、設定を更新します。

  9. 「作成」 をクリックします。 メタデータ・インポート資産がプロジェクトに追加され、メタデータ・インポート・ジョブが作成されます。 スケジュールを構成しなかった場合、インポートは即時に実行されます。 スケジュールを構成した場合、インポートは定義されたスケジュールで実行されます。

    重要: 別のメタデータ・インポートによって既にインポートされている同じ接続の資産は、新たにインポートされることはありませんが、更新されます。 これらの資産は、初期メタデータ・インポートに表示されなくなります。 最後に実行されたメタデータ・インポートにのみ、資産が含まれています。

メタデータ・インポート・ジョブの実行結果に応じて、完了メッセージまたはエラー通知が表示されます。

ジョブ実行が正常に完了した場合、警告で完了した場合、またはエラーで完了した場合は、完了メッセージが表示されます。 ジョブ実行全体が失敗した場合は、エラー通知が表示されます。 どちらのタイプの通知にも、特定のジョブ実行に関する詳細を提供するジョブ実行ログへのリンクが含まれています。

インポートが完了すると、以下の情報を含む資産のリストが表示されます。

  • 資産名。プロジェクトまたはカタログ内の資産へのリンクを提供します。
  • アセット・タイプ ( Dataなど) と形式 ( Relational tableなど)。
  • 資産コンテキスト (例:親やファイル・パスなど)。
  • 資産が最後にインポートされた日付と時刻。
  • インポート・ステータスは、インポートに成功した場合は Imported 、インポートに失敗した場合は In progress、または Removed となります。

インポートされたほとんどのデータ資産は、接続されたデータ資産と同じ方法で処理できます。 インポートされたアセットには、該当する場合、アセットの親を反映したタグが自動的に割り当てられます。

インポートされたデータ資産のプロファイル作成、分析、およびビジネス・コンテキストの提供を行うには、メタデータ・エンリッチ資産を作成し、メタデータ・インポート資産をデータ・スコープに含めます。

もっと見る

次のステップ

親トピック: メタデータのインポート

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細