資料の 英語版 に戻るDataStageにおける品質ステージ
DataStage の QualityStage ステージ
最終更新: 2024年12月09日
QualityStage の DataStage ステージを使って、データを調査、クレンジング、管理します。
QualityStage ステージ (データ品質ステージとも呼ばれる) を使用すると、以下の方法でデータを操作できます。
- データの競合とあいまいさを解決します。
- フリー・フォームまたは 自由形式や緩やかに制御されたソース行から、新しい属性や非表示の属性を発見することができます。
- データ型を標準形式に変換することにより、データを準拠させます。
ステージ関数
以下の表に、使用可能なステージとその機能の詳細を示します。
ステージ | アイコン | 関数 |
---|---|---|
データ・ルール | ジョブのフロー内の任意の場所でデータ品質を検査します。 | |
調査 | Investigate ステージの文字分析タイプは、データを分析し、分類して、単一パターンのレポートに変換します。 Investigate ステージのワード分析タイプは、個人名、ビジネス名、住所などのデータを分類するための一連のルールを使用します。 | |
Match Frequency | 入力データの列の値の度数分布を生成します。 マッチング・ジョブでは、頻度分布および入力データを使用します。 | |
One-source Match | 単一のソース・ファイルからのレコードを突き合わせます。 | |
標準化 | ソース・データを内部的に整合させるため、各データ・タイプには同じ種類のコンテンツとフォーマットがあります。 | |
2 ソースの一致 (Two-source Match) | 入力データの 2 つのソース (参照レコードとデータ・レコード) を比較して、一致するものを探します。 |