0 / 0
資料の 英語版 に戻る

頻度分布表

最終更新: 2024年12月13日
頻度分布表

データ資産に対して拡張プロファイル作成を実行すると、ソース・データに基づいて、資産の各列の個別の値に対して詳細な頻度分布が決定されます。

拡張プロファイル作成実行の設定を構成するときに、頻度分布情報のすべてまたは一部をデータベース表に書き込むことを選択できます。 拡張データ・プロファイル作成 (Advanced data profiling)を参照。 このテーブルには、標準のデータベース・クエリ、 IBM Knowledge Catalog API、または詳細列プロファイルを使用してアクセスできます。 しかし、列のプロファイルは、実際に格納されている値の数に関係なく、最初の100個の明確な値のみを表示します。

この表には、値ごとに以下の情報が含まれています。

度数分布表
列名 説明
AssetId プロジェクト内のデータ・アセットの ID。
ChangeDate 情報が更新された日付です。
ColumnName データ資産内の列の名前。
DataClassification コンマ (,) で区切られた、データ資産内の列に割り当てられたデータ・クラスの ID のリスト。 列にデータ・クラスが割り当てられていない場合、表には Uと表示されます。
DistinctValue 列の実際のデータ値。
すべての値は、実際のデータ型に関係なく、文字列として格納されます。 したがって、詳細列プロファイルで値をソートする際には、文字列のソート順が適用されます。
FrequencyCount この値が発生する頻度。
GeneralFormat データ値の文字パターンを表現する形式。 すべての英字は、文字の大文字化に応じて、大文字または小文字の A で表されます。
数字はすべて数字 9 で表されます。 スペースと特殊文字は、表示されるとおりに表示されます。
InferredDataType 推論されたデータ・タイプ (整数、ストリング、日付など)。
ProjectId 分析の実行に使用されたプロジェクトの ID。
PropertyLength ストリング・フィールドの長さ。
PropertyPrecision 数値フィールドの長さの合計。
PropertyScale 数値のスケールは、 数値フィールドの小数部分の合計長です。

これらの追加列は内部使用のために予約されており、予告なしに変更される場合があります。

  • クラス
  • ChangedByUser
  • DataClassificationStatusFlag
  • DomainPattern
  • DomainValueFlag
  • DomainValueFlagDate
  • DomainValueFlaggedByUser
  • FieldNumber
  • FormatFlag
  • FormatFlagDate
  • FormatFlaggedByUser
  • InvalidReasonCode
  • ODBC タイプ
  • SourceOfDistinctValue
  • TypeCode
  • TypeOfDomainValue

もっと見る

親トピック: メタデータ・エンリッチの結果の確認