ジョブおよびほとんどのツールを実行するときに、プロジェクトでコンピュート・リソースを使用します。 ツールによっては、ツールのランタイムの計算リソースを選択できる場合があります。
計算リソースは、環境テンプレートまたはハードウェアとソフトウェアの仕様と呼ばれます。 一般的に、より大きなハードウェア構成のコンピュート・リソースでは、より大きな使用コストが発生します。 プロジェクトに含まれる多くのツールは、計算リソースにwatsonx.aiStudio サービスを使用するが、一部のツールは他のサービスを使用する。 各サービスは、コンピュート使用量を個別に追跡および請求します。
これらのツールには、ランタイムを構成するための複数の選択肢があり、以下から選択できます:
以下のツールには、1 つのランタイム構成が自動的に割り当てられます。
以下のツールは計算リソースを消費しない:
- Metadata import
- マスター・データ構成
データ資産のプロファイル作成
プロジェクトまたはカタログ内のデータ資産のプロファイル作成には、 IBM Knowledge Catalogから 1 時間当たり 6 CUH が消費されます。プロファイル作成セッション当たりの CUH の最小量は 0.96 です。 プロファイルを作成するには、 IBM Knowledge Catalog サービスが必要です。
プロファイル作成のランタイムは、プロジェクトの 「管理」 タブの 「リソース使用量」 ページには表示されません。 プロファイル作成のためにコンピュート使用量を追跡することはできません。
メタデータのエンリッチメント
メタデータ・エンリッチメントには、 IBM Knowledge Catalog サービスが必要です。 メタデータ・エンリッチメント・ジョブが消費する IBM Knowledge Catalog の 1 時間当たりの CUH の量は、選択したエンリッチメント目標によって異なります。
メタデータ・エンリッチの目標 | キャパシティー・ユニット / 時 (CUH) |
---|---|
プロファイル・データ | 6 |
データのプロファイル作成と用語の割り当て | 8 |
メタデータ・エンリッチを実行すると、1 つ以上のジョブが開始されます。 各ジョブは、最大 200 個のテーブルを処理します。 一度に 200 を超える表をエンリッチすると、複数のジョブが開始されます。 例えば、500 個の表に対してメタデータ・エンリッチを実行する場合、3 つのジョブを開始します。 メタデータ・エンリッチ・ジョブごとに請求される CUH の最小量は 0.96 CUH です。
「メタデータの展開」 オプションまたはセマンティック用語の割り当てを使用したメタデータ・エンリッチメントのジョブは、ジョブごとに 10 個の表に制限されています。
メタデータ・エンリッチによって消費される CUH の量は、表の数と表の列によって異なります。 データの構造などの他の要因も、消費される CUH の量に影響を与える可能性があります。 次に例を示します。
- 500 個の列を持つ 500 個の表のデータをプロファイルするための 3 つのジョブは、合計で約 24 CUH を消費する可能性があります。
- データのプロファイルを作成し、500 個の列を持つ 500 個の表に用語を割り当てるための 3 つのジョブは、合計で約 30 CUH を消費する可能性があります。
プロジェクトの[管理]タブの[リソースの使用状況]ページに、メタデータエンリッチメントのランタイムが表示されない。 メタデータ・エンリッチメントのコンピュート使用量を追跡することはできません。
データ品質ルール
データ品質ルール・ジョブは、デフォルトの DataStage PX S 環境を使用する DataStage フローとして実行されます。これは、1 時間当たり 1 CUH (最小 1 分 CUH) を消費します。 データ品質ルールには、 IBM Knowledge Catalog サービスと DataStage サービスが必要です。
データ品質ルールのランタイムは、プロジェクトの 「管理」 タブの 「リソース使用状況」 ページに DataStage フローとして表示されます。
もっと見る
親トピック: プロジェクト