データ・クラスは、データ資産に含まれるデータのタイプ (データ・フィールドや表列など) を記述します。例えば、市区町村、電話番号、クレジット・カード番号などです。 IBM Knowledge Catalogは、定義済みのデータ・クラスのセットを提供します。
データ・クラスは、組織がデータ・エレメントにビジネス用語を割り当てるのに役立つアルゴリズムです。この割り当ては、データの構文に基づいて行われます。 データ・クラスは、ビジネス用語割り当て推奨の精度を高めるために、メタデータ・エンリッチ中に使用されます。 これらは、セマンティック・ビジネス用語に対する構文上の対応と見なすことができます。
データ・クラスは、データ保護ルールやデータ品質ルールなどの実用的なルールを表現するために使用できます。 また、データ品質において、正しくない可能性がある疑わしいエントリーを検出する役割も果たします。
カスタム・データ・クラス成果物を作成するときに、 一致するデータを使用 して、データを自動的に分類する方法を指定できます。 分類やビジネス用語といった関連成果物も追加できます。 これにより、それらのビジネス用語は、データ・クラスをデータ資産の列に割り当てる際に、割り当てが推奨されます。
管理対象のカタログでは、表データが含まれるデータ資産に自動でプロファイルが作成され、データ・クラスが割り当てられます。 管理対象外のカタログでは、 リレーショナル・データ資産のプロファイル作成 を選択して、割り当てるデータ・クラスを選択することができます。 ポリシーが適用されているかどうかや、プロジェクトに関係なく、非構造化データ資産をカタログに追加すると、その資産のプロファイルが自動的に作成されます。 すべてのカタログ・ユーザーは、資産の 概要 ページと プロファイル ページの資産プレビューでデータ・クラスを確認できます。