テクニカル・メタデータとリネージ・メタデータをインポートして、データ資産をプロジェクトまたはカタログに追加できます。 プロジェクトでは、カタログに掲載する前にデータを準備し、分析することができます。
メタデータをデータアセットとしてプロジェクトにインポートし、カタログに公開する前にデータの準備と分析を行います。 このようなデータ資産をプロファイリングし、データ品質を分析し、メタデータエンリッチメントを実行してビジネスコンテキストを提供する用語を割り当てます。 より深い品質分析を行うには、データ資産のデータ品質ルールを実行する。 また、データが準備なしで共有できる状態であれば、データ資産を直接カタログに追加することもできます。 系統メタデータをインポートして、データがどこから来て、どのように変化し、どこに流れているかを確認できます。
- サポートされる接続
- サポートされるコネクタの Metadata importの列を参照してください。 サポートされている接続のリストを取得したり、メタデータ・インポート・アセットを作成したりするには、ユーザー・インターフェースの代わりにAPIを使用できます。 これらのAPIへのリンクはLearn moreセクションに記載されている。
- 必要な権限
- メタデータのインポートを作成、管理、実行するには、これらのロールと権限が必要です:
- プロジェクトの管理者または編集者の役割。
- アセットをインポートまたは公開するカタログの管理者または編集者ロール。
- インポートされるデータ資産のデータソースへの接続へのアクセスと、対応するデータベースのSELECTまたは同様の権限。
- リネージメタデータをインポートするためのデータリネージパーミッションを管理する。
前提条件
新しいデータ・ソースのメタデータ・インポートの作成を開始する前に、以下の手順を完了してください:
各データソースは、様々な接続の詳細を必要とする。 この情報は、コネクターセクションの各接続トピックに記載されています。 メタデータ・インポートのコンテキストにおけるデータ・ソースの定義と接続の詳細については、'メタデータのインポートを設計するデータソース を参照のこと。
メタデータ・インポート資産の作成およびメタデータのインポート
メタデータ・インポート・アセットと、メタデータをプロジェクトまたはカタログにインポートするためのジョブを作成します:
プロジェクトを開き、プロジェクトの「アセット」ページで「新規アセット」>「データアセットのメタデータをインポート」をクリックします。
メタデータ・インポートの名前を指定します。 オプションで、説明を指定することもできます。
メタデータのインポート資産に割り当てるタグを選択し、検索を簡単にします。 タグ名を入力すれば、新しいタグを作成できる。
インポートのゴールを選択します。 どちらか、あるいは両方のゴールを選択することができる。 インポートゴールを参照。
アセットメタデータのインポート目標を選択した場合は、インポート先を選択します。 メタデータは、作業中のプロジェクトや、編集者または管理者の役割を持っているカタログにインポートできます。 インポートターゲットを参照。
メタデータ・インポートのデータ・ソースの詳細を入力してください。 系統メタデータをインポートする際には、データソースの定義が必要である。 アセット メタデータをインポートするときは、データ ソース定義または接続のいずれかを選択します。 データソースによっては、スキャナーも選択する必要があります。 データソースを参照。
メタデータ・インポートのスコープを定義します。 輸入の範囲」を参照。 データ・ソースのサイズと内容によっては、すべての資産をインポートする必要がなく、サブセットを選択してインポートしたい場合があります。 完全なスキーマまたはフォルダーを含めることも、個々の表やファイルにドリルダウンすることもできます。 スキーマまたはフォルダーを選択すると、そのスキーマまたはフォルダーに含まれる項目の数を即時に確認できます。 このようにして、セット全体を含めるのか、またはサブセットのみの方が目的に適しているのかを判別できます。
系統メタデータをインポートする際、以下の方法でデータの範囲を変更することができる:
- スキーマやレポートなど、データソース内の特定のオブジェクトを選択します。
- .zipファイルに外部入力を追加し、血統に関連するデータを追加する。
- ファイルシステムやGitリポジトリからメタデータを追加する。
オプションで、より良い系統分析のために、外部入力のプレースホルダー置換を定義することができる。 Configureをクリックし、詳細を定義する。 プレースホルダーの置き換えを参照。
スケジュールされたインポート・ジョブを実行するかどうかを定義します。 スケジュールを設定しない場合は、メタデータ・インポート資産の保存時にインポートを実行します。 インポートは、いつでも手動で再実行できます。 スケジューリングオプションを参照。
系統メタデータをインポートすれば、どの系統フェーズを実行するかを決めることができる。 リネージュのインポート段階を参照。
インポートの動作をカスタマイズする。 特定のプロパティが更新されないようにしたり、再インポートに含まれない既存のアセットを削除したりすることができます。 高度なインポートオプションを参照してください。
メタデータ・インポート構成を確認します。 変更するには、タイル上の編集アイコン「」をクリックし、設定を更新する。
「作成」 をクリックします。 メタデータ・インポート資産がプロジェクトに追加され、メタデータ・インポート・ジョブが作成されます。 スケジュールを構成しなかった場合、インポートは即時に実行されます。 スケジュールを設定した場合、インポートは定義されたスケジュールで実行されます。
重要: 別のメタデータ・インポートによって既にインポートされている同じ接続の資産は、新たにインポートされることはありませんが、更新されます。 これらの資産は、初期メタデータ・インポートに表示されなくなります。 最後に実行されたメタデータ・インポートにのみ、資産が含まれています。
メタデータ・インポート・ジョブの実行結果に応じて、完了メッセージまたはエラー通知が表示されます。
ジョブの実行が正常に完了した場合、警告付きで完了した場合、またはエラーで完了した場合、完了メッセージが表示されます。 ジョブ実行全体が失敗した場合、エラー通知が表示されます。 どちらのタイプの通知にも、特定のジョブ実行に関する詳細を提供するジョブ実行ログへのリンクが含まれています。
インポートが完了すると、アセットリストに以下の情報が表示されます:
- プロジェクトまたはカタログ内のアセットへのリンクを提供するアセット名。
- The asset type, such as
Data
orReport
. データ資産の場合、Relational table
のようなフォーマットも表示されます。 その他のアセットタイプの場合、フォーマット欄にはダッシュ(-)が表示されます。 - 資産コンテキスト (例:親やファイル・パスなど)。
- 資産が最後にインポートされた日付と時刻。
- インポート・ステータスは、インポートに成功した場合は
Imported
、インポートに失敗した場合はIn progress
、またはRemoved
となります。
ほとんどのインポートされたデータ資産を、接続されたデータ資産と同じように扱うことができます。 インポートされたアセットには、該当する場合、アセットの親を反映したタグが自動的に割り当てられます。
インポートしたデータ資産のプロファイリング、分析、ビジネス・コンテキストの提供を行うには、メタデータ・エンリッチメント・アセットを作成し、メタデータ・インポート・アセットをデータ・スコープに含めます。
もっと見る
次のステップ
親トピック メタデータのインポート