プロジェクト内の Data Refinery フロー、 SPSS Modeler フロー、ノートブック、およびスクリプトなどのツールで資産またはファイルを実行するジョブを作成します。
ジョブを作成するときには、ジョブのプロパティー (名前、定義、環境ランタイム、スケジュール、通知の仕様など) をさまざまなページで定義します。 ジョブを即時に実行することも、またはスケジュールされている次の間隔でジョブが実行されるのを待機することもできます。
ジョブが開始されるたびに、ジョブ実行が作成されます。これをモニターして、前の実行のジョブ実行履歴と比較するために使用できます。 ジョブ実行ログで、各ジョブ実行、ジョブ状態の変更、およびジョブ失敗に関する詳細情報を閲覧できます。
ジョブの作成方法は、資産またはファイルによって異なります。
資産またはファイル | ツールでのジョブを作成する | 「資産」ページからのジョブを作成する | ジョブを自動的に作成する | 詳細情報 |
---|---|---|---|---|
Data Refinery フロー | ✓ | ✓ | Data Refinery でのジョブの作成 | |
SPSS Modeler フロー | ✓ | ✓ | SPSS Modeler でのジョブの作成 | |
マスキング・フロー | ✓ | 「アセット」ページからのマスキング・フロー・ジョブの作成 | ||
DataStage フロー | ✓ | ✓ | ✓ | DataStage でのジョブの作成 |
IBM Match 360 | ✓ | IBM Match 360でのジョブの作成 | ||
ノートブック・エディターで作成されたノートブック | ✓ | ✓ | ノートブック・エディターでのジョブの作成 | |
Metadata import | ✓ | Metadata import ・ジョブ | ||
メタデータのエンリッチメント | ✓ | メタデータ・エンリッチメント・ジョブの作成 | ||
データ品質ルール | ✓ | ✓ | ✓ | データ品質ルールを実行するためのジョブの作成 |
パイプライン | ✓ | パイプラインのジョブの作成 |
ジョブの自動作成
一部のジョブは、プロジェクトで資産が作成されるときに自動的に作成されます。 これらのジョブは、プロジェクトの ジョブ ページにリストされます。 「ジョブ」ページから、ジョブ実行の詳細の表示、ジョブ設定の変更、ジョブの手動実行、およびジョブの削除を行うことができます。 「ジョブ」 ページからメタデータ・インポート・ジョブまたはメタデータ・エンリッチ・ジョブのジョブ設定を編集することはできません。 これは、プロジェクトの 「資産」 ページからのみ行うことができます。
ジョブは、以下の状況で作成されます。
- DataStage フロー。 DataStage でのジョブの作成を参照してください。
- DataStage データ品質ルールのフロー。 データ品質ルールを実行するためのジョブの作成を参照してください。
- メタデータ・インポート資産。 Metadata import ジョブを参照してください。
- メタデータ・エンリッチマント資産。 メタデータ・エンリッチメント・ジョブの管理」を参照してください。
「資産」ページからのジョブの作成
プロジェクトの 「資産」 ページから資産を実行するジョブを作成できます。
- 必要な権限
- プロジェクト内で 編集者 または 管理者 の役割を持っている必要があります。
サービス IDから API キーを使用してジョブを実行することはできません。
プロジェクトの 「資産」 ページからリストされた資産のジョブを作成するには、以下のようにします。
アセットタイプのセクションからアセットを選択し、メニューアイコン「
」から「New job」を選択します。
名前と説明 (オプション) を入力して、ジョブの詳細を定義します。
設定を選択できる場合は、ジョブに必要な設定を指定します。
構成を選択できる場合は、ジョブの環境ランタイムを選択します。 アセット・タイプに応じて、環境変数やスクリプト引数など、オプションで追加の設定を構成できます。
終了したジョブ実行やジョブ実行の成果物が蓄積されすぎないように、終了したジョブ実行やログやノートブックの結果などのジョブ実行の成果物を保持する期間を設定します。 ジョブ実行を保持する日数または保持するジョブ実行の最後の数のいずれかを選択できます。
「スケジュール」 ページで、オプションで一回限りのスケジュールまたは繰り返しスケジュールを追加できます。
「繰り返し」 オプションと、値 nを指定した 「分」 の単位を選択すると、ジョブは時間の開始時に実行され、 nの倍数ごとに実行されます。 例えば、値 11 を指定すると、1 時間ごとに 0、11、22、33、44、および 55 分で実行されます。
「スケジュールの開始」 オプションも選択した場合、ジョブは、 「開始時刻」 フィールドに指定した時刻より後の時間の n の倍数になると実行を開始します。 例えば、「 Start of Time 」値に 10:24 と入力し、「 Repeat 」を選択して、14 分ごとに繰り返すようにジョブを設定した場合、ジョブは 1 0: 42、10:56、11:00、11:14 に実行されます。 11:28、11:42、11:56、以下同様。
タイム・ゾーンを変更することはできません。Web ブラウザーのタイム・ゾーンでジョブ・スケジュールを設定する必要があります。 スケジュールは、ジョブが実行される計算ノードのタイム・ゾーンに変換されます。
特定の曜日を除外すると、ジョブが想定どおりに実行されない場合があります。 その理由としては、スケジュールを作成するユーザーのタイム・ゾーンと、ジョブが実行される計算ノードのタイム・ゾーンが一致していないことなどがあります。
注: Web ブラウザーのタイム・ゾーンが夏時間調整 (DST) の後にローカル・タイム・ゾーンに設定されている場合は、スケジュールされたジョブの表示が異なることがあります。 例えば、スケジュールされたジョブが、 8:00PM 協定世界時 (UTC) に対応する 3:00PM 東部標準時ゾーン (EST) に毎日表示されるとします。 ローカル・タイム・ゾーンが東部夏時間帯 (EDT) に変更されると、スケジュールされたジョブは 8:00PM (UTC) で引き続き実行され、毎日 4:00PM (EDT) として表示されるようになります。
API キーは、スケジュールされたジョブの作成時に生成され、今後の実行ではこの API キーが使用されます。 スケジュールされたジョブを作成していないが、変更することを選択した場合は、ジョブの変更時に API キーが自動的に生成され、今後の実行ではこの API キーが使用されます。(オプション): ジョブの通知を表示する場合に選択します。 受信するアラートのタイプを選択できます。
ジョブ設定を確認します。 その後、ジョブを作成してすぐに実行するか、ジョブを作成して後で実行します。
ジョブの管理
プロジェクトの ジョブ ページから、プロジェクトに存在するすべてのジョブを閲覧できます。 プロジェクトの 管理者 役割または 編集者 役割を使用して、ジョブの詳細を閲覧および編集できます。 手動でジョブを実行したり、ジョブを削除したりすることができます。 プロジェクトの ビューアー 役割を使用して、ジョブの詳細のみを閲覧できます。 ビューアー役割を持つジョブを実行したり削除したりすることはできません。
特定のジョブの詳細を表示するには、そのジョブをクリックします。 ジョブの詳細ページから、以下を行うことができます:
- そのジョブのランと各ランのステータスを表示します。 実行が失敗した場合、実行のトラブルシューティングに役立てるために、実行を選択してログ末尾を表示するか、またはログ・ファイル全体をダウンロードできます。 失敗した実行は、一時的な接続の問題または環境の問題に関連している可能性があります。 ジョブの実行を再試行してください。 それでもジョブが失敗した場合は、ログをお客様サポートに送信できます。
- ジョブ設定の編集 。例えば、スケジュール設定を変更したり、別の環境テンプレートを選択したりするために、 「ジョブの編集」をクリックします。
- ジョブのアクションバーから'走るアイコン'
をクリックしてジョブを手動で実行する入力する。 スケジュールとデマンドに基づいて、スケジュールされたジョブを開始できます。
- ジョブのアクションバーからDelete'
をクリックしてジョブを削除します。
ツールでのジョブの表示および編集
以下のツールを使用して、資産に関連付けられたジョブ設定を直接表示および編集できます:
- Data Refinery
- DataStage
- Match 360
- ノートブック・エディターまたはビューアー
- パイプライン
Data Refinery、ノートブック、およびパイプラインでのジョブの表示と編集
- ツールバーのジョブアイコン「
」をクリックし、「Save and view jobs」を選択します。 このアクションにより、資産に存在するジョブがリストされます。
- ジョブを選択すると、その詳細が表示されます。 ジョブの編集をクリックして、ジョブ設定を変更できます。
DataStage でのジョブの表示および編集
DataStage フローのランタイム設定を表示または編集するには:
- フローを開き、設定アイコン「
」をクリックする。
- 設定 ページで 実行 をクリックしてください。
IBM Match 360 でのジョブの表示および編集
IBM Match 360でジョブを表示および管理するには、以下のようにします。
Cloud Pak for Data ナビゲーション・メニューから、 「データ」 > 「マスター・データ」 を選択して、 IBM Match 360 サービスを開きます。
マスター・データ・ホーム に移動し、 「ジョブ」 タブを開きます。
「ジョブ」 タブには、この IBM Match 360 サービス・インスタンスで実行されたジョブ、または現在実行されているジョブのリストが表示されます。 ジョブ ID、ジョブ・タイプ、タイム・スタンプ情報、および状況などの詳細を表示できます。 現在実行中のジョブを取り消すこともできます。
あるいは、どのマスターデータ設定ページからでも、アクションバーのプロセスアイコン「
」をクリックすると、実行中および最近完了したジョブのリストが表示されます。
もっと見る
- Data Refinery でのジョブの作成
- DataStage でのジョブの作成
- データ・プライバシーを使用したジョブの作成
- IBM Match 360でのジョブの作成
- ノートブック・エディターまたはノートブック・ビューアーでのジョブの作成
- データ品質ルールを実行するためのジョブの作成
- メタデータ・インポート・ジョブの作成
- メタデータ・エンリッチメント・ジョブの管理
- パイプラインのジョブの作成
親トピック: プロジェクトでの作業