1 次キー分析を実行して、リレーショナル・データベースのデータ資産内の単一または複合 1 次キーを識別します。 主キーは、データ資産内の各レコードを一意的に識別します。 各データ資産は、主キーを 1 つのみ持つことができます。
データに既に定義されている主キーを検証し、主キーの候補となる列を識別します。 主キーはユニークでなければならず、NULL 値は使用できません。
このタイプの分析では、データの固有 ID として修飾される列を見つけることにより、データ資産の単一列の主キーを識別します。 複数列または 複合 主キーを識別するために、分析は、列のどの組み合わせに固有値が含まれているかを判別し、それらを主キーの候補にします。 異なる列の組み合わせの値が評価され、連結された値の固有性が計算されます。 隣接する列のみが検査されます。
エンリッチメント設定 または個々の実行のいずれかで、確信度が定義されたしきい値を超える列および列の組み合わせのみが、主キーとして推奨されます。 1 次キーが既にデータに定義されている場合、このキーは自動的に割り当てられます。 この情報は、メタデータのインポートに明示的に含める必要があります。 1 次キー分析の結果を使用して、定義された 1 次キーを検証することもできます。
前提条件
主キー分析を実行するには、 DataStage サービスをデプロイする必要があります。
メタデータ・エンリッチメントの一部として実行されるすべての操作には、セキュアな許可のための資格情報が必要です。 通常、ユーザーの API キーは、このような長期実行操作を中断することなく実行するために使用されます。 1 次キー分析を実行しようとしたときに資格情報が使用できない場合は、API キーの作成を求めるプロンプトが出されます。 その後、その API キーがタスク資格情報として保存されます。 ユーザー API キーの管理を参照してください。
データ・ソースへの接続のいずれかがロックされている場合は、個人の資格情報を入力するように求められます。 これは、接続を永続的にアンロックする一回限りのステップです。
最初にアセット・プロファイルを作成しなくても、主キー分析を実行できます。 分析は、列の値の度数分布などのプロファイル情報に依存しません。 代わりに、列データが直接分析されます。
主キーの手動設定
「プロファイル・データ」 オプションを使用してデータが既に分析されている場合は、キー分析や関係分析を実行せずに主キーを設定することも、割り当てを変更することもできます。 資産の列ビューを開くには、資産名をクリックするか、オーバーフロー・メニューから 「列の表示」 を選択します。
- 単一列の主キーを設定するには、列を選択し、ツールバーから 「詳細」>「主キーとして割り当て」 を選択します。
- 複数列の主キーを設定するには、キーを構成する列を選択し、ツールバーから 「詳細」>「複合主キーとして割り当て」 を選択します。
1 次キーを置換すると、古い 1 次キーの関係は割り当て解除されます。 新しい関係を設定する必要があります。
主キー分析の実行
1 つ以上の資産に対して主キー分析を実行するには、以下のようにします。
メタデータ・エンリッチ資産を開きます。
「アセット」 タブで、必要に応じてアセットを選択します。
ツールバーから 「エンリッチ」>「主キーの識別」 を選択します。
デフォルトでは、この分析は単一列に対して実行されます。 ただし、1 つの列が 1 次キーの基準を満たしていない場合があります。 この場合、複数の列に対して分析を実行して複合主キーを作成することを選択できます。 分析では、異なる列の組み合わせの値を連結し、連結された値の固有性を計算し、列のどの組み合わせに固有値が含まれているかを判別して、それらを主キー候補にします。 このような分析は、データ資産のサイズによっては非常に時間がかかる場合があります。
「実行 (Run)」 をクリックします。 分析が完了すると通知されますが、新しい 1 次キーを表示するには、エンリッチ結果を最新表示する必要がある場合があります。
デフォルトでは、分析中に識別されたすべての主キーが候補状況になります。これは、データに定義済みの主キーが既に含まれていない限り、候補キーとして表示されることを意味します。 この場合、これらの列は分析時に主キーとして割り当てられます。
別の主キー分析を実行すると、現在の分析中に検出されなかった、以前に推奨された主キーがすべて削除されます。 例えば、単一列の主キー分析を実行すると、前の分析で識別されたすべての複合主キー候補が削除されます。
分析結果の確認とキーの割り当て
資産の詳細パネルの 「キー」 タブで、資産のキーを確認します。 データに既に 1 次キーが含まれている場合は、ここに割り当てられたものとして表示されます。 さらに、推奨されるキーがここにリストされます。 割り当てられた主キーを変更するには、編集アイコンをクリックします。
キーの完全なリストは、以下の情報を提供します。
- 複合 1 次キーの 1 次キーまたは列名のリストとして推奨または割り当てられている列の名前
- 割り当てられた主キーまたは候補の主キーを構成する列の数
- 割り当てられた主キーまたは候補の主キーを構成する列のデータ・タイプ
- キーの割り当てまたは提案の信頼性スコア
- キーごとの個別値、固有値、および NULL 値の数とパーセンテージ
- 鍵の状況。「 割り当て済み 」または「 推奨 」のいずれかです。
- 列が最後に変更された日付。
1 次キーを割り当てるか、割り当てられたキーを置き換えるには、キーのオーバーフロー・メニューから 「割り当て」 を選択します。 既存の 1 次キーを置き換えると、古い 1 次キーの関係はすべて割り当て解除されます。 その後、新しい関係を設定できます。
キーの割り当て解除または削除
割り当てられたキーを割り当て解除できます。 この場合、この 1 次キーの関係も割り当て解除され、キーの状況は「推奨」に設定されます。 その後、新しい 1 次キーを割り当て、対応する関係を設定することができます。
また、割り当てられたキーまたは推奨されたキーを完全に削除することもできます。 このキーの関係はすべて割り当て解除されます。 1 次キー分析を再実行すると、削除されたキーが提案されるか、再度割り当てられる可能性があります。
ジョブ実行の詳細へのアクセス
サイド・パネルから一般的なメタデータ強化のジョブ詳細にアクセスできますが、プロジェクトの 「ジョブ」 タブに移動して、1 次キー分析のジョブを表示する必要があります。 ジョブのタイプは 「メタデータ・エンリッチメント資産のキー分析」です。 ジョブ名は、パターン metadata_enrichment_name (PK Detection) に従います。
もっと見る
親トピック: データ資産の強化