頻度分布表

最終更新: 2025年3月28日
頻度分布表

データ資産に対して拡張プロファイル作成を実行すると、ソース・データに基づいて、資産の各列の個別の値に対して詳細な頻度分布が決定されます。

拡張プロファイル作成実行の設定を構成するときに、頻度分布情報のすべてまたは一部をデータベース表に書き込むことを選択できます。 拡張データ・プロファイル作成 (Advanced data profiling)を参照。 このテーブルには、標準のデータベース・クエリ、 IBM Knowledge Catalog API、または詳細列プロファイルを使用してアクセスできます。 しかし、列のプロファイルは、実際に格納されている値の数に関係なく、最初の100個の明確な値のみを表示します。

拡張プロファイル作成実行の設定を構成するときに、頻度分布情報のすべてまたは一部をデータベース表に書き込むことを選択できます。 拡張データ・プロファイル作成 (Advanced data profiling)を参照。 このテーブルには、列の詳細プロフィールからアクセスできる。

しかし、列プロファイルでは、文字列値のような非数値の分布統計は、実際に格納されている値の数に関係なく、最初の100個の明確な値のみを表示します。 出力テーブルのすべての値にアクセスするには、標準的なデータベースクエリまたは IBM Knowledge Catalog API を使用します。

この表には、値ごとに以下の情報が含まれています。

度数分布表
列名 詳細
AssetId プロジェクト内のデータ・アセットの ID。
ChangeDate 情報が更新された日付です。
ColumnName データ資産内の列の名前。
DataClassification コンマ (,) で区切られた、データ資産内の列に割り当てられたデータ・クラスの ID のリスト。 列にデータ・クラスが割り当てられていない場合、表には Uと表示されます。
DistinctValue 列の実際のデータ値。
すべての値は、実際のデータ型に関係なく、文字列として格納されます。 したがって、詳細列プロファイルで値をソートする際には、文字列のソート順が適用されます。
FrequencyCount この値が発生する頻度。
GeneralFormat データ値の文字パターンを表現する形式。 すべての英字は、文字の大文字化に応じて、大文字または小文字の A で表されます。
数字はすべて数字 9 で表されます。 スペースと特殊文字は、表示されるとおりに表示されます。
InferredDataType 推論されたデータ・タイプ (整数、ストリング、日付など)。
ProjectId 分析の実行に使用されたプロジェクトの ID。
PropertyLength ストリング・フィールドの長さ。
PropertyPrecision 数値フィールドの長さの合計。
PropertyScale 数値のスケールは、 数値フィールドの小数部分の合計長です。

これらの追加列は内部使用のために予約されており、予告なしに変更される場合があります。

  • クラス
  • ChangedByUser
  • DataClassificationStatusFlag
  • DomainPattern
  • DomainValueFlag
  • DomainValueFlagDate
  • DomainValueFlaggedByUser
  • FieldNumber
  • FormatFlag
  • FormatFlagDate
  • FormatFlaggedByUser
  • InvalidReasonCode
  • ODBC タイプ
  • SourceOfDistinctValue
  • TypeCode
  • TypeOfDomainValue

もっと見る

親トピック: メタデータ・エンリッチの結果の確認