パイプライン・ノードの構成 | IBM Cloud Pak for Data as a Service

資料の英語版に戻る

パイプライン・ノードの構成

パイプラインのノードを構成して、入力を指定し、パイプラインの一部として出力を作成します。

ワークスペース・スコープの指定

デフォルトでは、パイプラインのスコープは、パイプラインを含むプロジェクトです。パイプラインで使用される資産を見つけるために、デフォルト以外のスコープを明示的に指定できます。スコープは、資産を含むプロジェクト、カタログ、またはスペースです。ユーザー・インターフェースから、スコープを参照できます。

入力モードの変更

ノードを構成するときに、さまざまな方法でデータやノートブックを含むリソースを指定できます。例えば、名前または ID を直接入力したり、資産を参照したり、パイプライン内の前のノードからの出力を使用してフィールドにデータを取り込んだりします。フィールドで使用できるオプションを確認するには、フィールドの入力アイコンをクリックします。コンテキストに応じて、以下のようなオプションがあります。

リソースの選択: 資産ブラウザーを使用して、データ・ファイルなどの資産を見つけます。
パイプライン・パラメーターの割り当て: パイプライン・パラメーターで構成された変数を使用して値を割り当てます。詳しくは、グローバル・オブジェクトの構成を参照してください。
別のノードから選択: このフィールドの値として、パイプライン内の以前のノードからの出力を使用します。
式を入力します。値を割り当てるコードを入力するか、リソースを識別します。詳しくは、要素のコーディングを参照してください。

パイプライン・ノードとパラメーター

以下のタイプのパイプライン・ノードを構成します。

ノードのコピー
ノードの作成
Wait
制御ノード
ノードの更新
ノードの削除
実行ノード

ノードのコピー

コピー・ノードを使用して、パイプラインに資産を追加したり、パイプライン資産をエクスポートしたりします。

選択した資産をプロジェクトまたはスペースから空でないスペースにコピーします。以下の資産をスペースにコピーできます。

AutoAI エクスペリメント
コード・パッケージ・ジョブ
接続
Data Refinery フロー
Data Refinery ジョブ
データ資産
DataStageジョブ
デプロイメント・ジョブ
環境
関数
ジョブ
モデル
ノートブック
ノートブック・ジョブ
パイプライン・ジョブ
スクリプト
スクリプト・ジョブ
SPSS Modeler ジョブ

アセットのコピー

入力パラメーター

パラメーター	説明
ソース資産	リストに追加するソース資産を参照または検索します。また、パイプライン・パラメーターを使用するか、別のノードの出力を使用するか、資産 ID を入力して、資産を指定することもできます。
ターゲット	ターゲット・スペースを参照または検索します。
コピー・モード	フローが資産のコピーを試行し、同じ名前のケースが 1 つ存在する場合の処理方法を選択します。 `ignore`、 `fail`、 `overwrite` のいずれかかです

出力パラメーター

パラメーター	説明
出力資産	コピーされた資産のリスト

資産のエクスポート

スコープから選択した資産 (例：プロジェクトやデプロイメント・スペースなど) をエクスポートします。デフォルトでは、この操作により、すべての資産がエクスポートされます。エクスポートするリソースのリストを作成することにより、資産の選択を制限できます。

入力パラメーター

パラメーター	説明
アセット	エクスポート可能なすべての項目をエクスポートするには「スコープ」を選択し、エクスポートする特定の項目のリストを作成するには「リスト」を選択します。
ソース・プロジェクトまたはスペース	エクスポートする資産を含むプロジェクトまたはスペースの名前
エクスポートされたファイル	エクスポート・ファイルを保管するためのファイルの場所
作成モード (オプション)	フローが資産の作成を試行し、同じ名前の資産が 1 つ存在する場合の処理方法を選択します。 `ignore`、 `fail`、 `overwrite` のいずれかかです

出力パラメーター

パラメーター	説明
エクスポートされたファイル	エクスポート・ファイルへのパス

注:

ノートブックを含むプロジェクト資産をエクスポートする場合、最新バージョンのノートブックがエクスポート・ファイルに組み込まれます。 「ノートブック・ジョブの実行」 ノードを含むパイプラインが、最新バージョン以外の別のノートブック・バージョンを使用するように構成されている場合、エクスポートされたパイプラインは、インポート時に最新バージョンを使用するように自動的に再構成されます。これにより、予期しない結果が生じるか、インポート後に何らかの再構成が必要になる可能性があります。
エクスポートされたプロジェクトに自己完結型の資産は、新規プロジェクトのインポート時に保持されます。そうしないと、エクスポートされた資産のインポート後に、いくつかの構成が必要になる可能性があります。

資産のインポート

エクスポートされた資産を含む ZIP ファイルから資産をインポートします。

入力パラメーター

パラメーター	説明
ターゲットをインポートするパス	インポートする資産を参照または検索します
インポートするファイルをアーカイブする	ZIP ファイルまたはアーカイブへのパスを指定します

注: ファイルをインポートすると、インポートされた資産へのパスと参照が、以下の規則に従って更新されます。

エクスポートされたプロジェクトまたはスペースからの資産への参照は、インポート後に新規プロジェクトまたはスペースで更新されます。
エクスポートされたプロジェクトの資産が (別のプロジェクトに含まれている) 外部資産を参照している場合、外部資産への参照はインポート後も保持されます。
外部資産が存在しなくなった場合、パラメーターは空の値に置き換えられるため、有効な資産を指すようにフィールドを再構成する必要があります。

ノードの作成

パイプラインに資産を作成するためのノードを構成します。

AutoAI エクスペリメントの作成

このノードは、 AutoAI 分類または回帰エクスペリメントをトレーニングし、モデル候補パイプラインを生成するために使用します。

入力パラメーター

パラメーター	説明
AutoAI エクスペリメント名	新規エクスペリメントの名前
有効範囲 (Scope)	エクスペリメントが作成されるプロジェクトまたはスペース。
予測タイプ	以下のデータのモデルのタイプ: 2 項、分類、または回帰
予測列 (ラベル)	予測列名
正のクラス (オプション)	二項分類エクスペリメントのポジティブ・クラスを指定します
学習データ分割率 (オプション)	トレーニングから保留にして、パイプラインのテストに使用するデータのパーセンテージ (浮動小数点: 0.0 - 1.0)
組み込むアルゴリズム (オプション)	使用する推定量のリストを制限します (リストは学習タイプに依存します)
使用するアルゴリズム	使用する推定量のリストを指定します (リストは学習タイプに依存します)
メトリックの最適化 (オプション)	モデルのランク付けに使用されるメトリック
ハードウェア仕様 (オプション)	エクスペリメントのハードウェア仕様を指定します
AutoAI エクスペリメントの説明	エクスペリメントの説明
AutoAI エクスペリメント・タグ (オプション)	エクスペリメントを識別するためのタグです
作成モード (オプション)	パイプラインがエクスペリメントの作成を試行し、同じ名前のケースが 1 つ存在する場合の処理方法を選択します。 `ignore`、 `fail`、 `overwrite` のいずれかかです

出力パラメーター

パラメーター	説明
AutoAI エクスペリメント	保存されたモデルへのパス

AutoAI 時系列エクスペリメントの作成

このノードは、 AutoAI 時系列エクスペリメントをトレーニングし、モデル候補パイプラインを生成するために使用します。

入力パラメーター

パラメーター	説明
AutoAI 時系列エクスペリメント名	新規エクスペリメントの名前
有効範囲 (Scope)	パイプラインが作成されるプロジェクトまたはスペース
予測列 (ラベル)	1 つ以上の予測列の名前
日付/時刻列 (オプション)	日付/時刻列の名前
サポート機能の将来の価値を活用する	予測を改善するために (外因性の) 特徴量をサポートするための考慮事項を有効にするには、「True」を選択します。例えば、アイスクリーム販売を予測するための温度フィーチャーを組み込みます。
サポート・フィーチャー (オプション)	サポート機能を選択してリストに追加
代入方法 (任意指定)	データ・セットに欠損値を代入するための手法を選択します
代入しきい値 (オプション)	指定された代入方法で提供する欠損値のパーセントの上限しきい値を指定します。しきい値を超えると、エクスペリメントは失敗します。例えば、10% の値を代入できるように指定し、データ・セットに 15% の値が欠落している場合、エクスペリメントは失敗します。
充てんタイプ	指定された代入方法で Null 値を入力する方法を指定します。すべての値の平均値とすべての値の中央値を指定するか、または塗りつぶし値を指定します。
塗りつぶし値 (オプション)	NULL 値を置換するために値を指定することを選択した場合は、このフィールドに値を入力します。
最終トレーニング・データ・セット	トレーニング・データのみを使用して最終パイプラインをトレーニングするか、トレーニング・データとホールドアウト・データを使用して最終パイプラインをトレーニングするかを選択します。トレーニング・データを選択した場合、生成されるノートブックには、ホールドアウト・データを取得するためのセルが含まれます。
ホールドアウト・サイズ (オプション)	トレーニング・データをトレーニング・データとホールドアウト・データに分割する場合は、パイプラインを検証するためのホールドアウト・データとして予約するトレーニング・データのパーセンテージを指定します。ホールドアウト・データは、データの 3 分の 1 を超えません。
バックテストの数 (オプション)	時系列エクスペリメントを相互検証するためのバックテストのカスタマイズ
ギャップの長さ (オプション)	各バックテストのトレーニング・データ・セットと検証データ・セットの間の時間ポイント数を調整します。パラメーター値がゼロ以外の場合、ギャップ内の時系列値は、エクスペリメントのトレーニングや現在のバックテストの評価には使用されません。
ルックバック・ウィンドウ (オプション)	現在の時点を予測するために使用される過去の時系列値の数を示すパラメーター。
「予測」ウィンドウ (オプション)	ルックバック・ウィンドウ内のデータに基づいて予測する範囲。
組み込むアルゴリズム (オプション)	使用する推定量のリストを制限します (リストは学習タイプに依存します)
実行するパイプライン数	オプションで、作成するパイプラインの数を調整します。パイプラインが増えると、トレーニング時間とリソースが増加します。
ハードウェア仕様 (オプション)	エクスペリメントのハードウェア仕様を指定します
AutoAI 時系列エクスペリメントの説明 (オプション)	エクスペリメントの説明
AutoAI エクスペリメント・タグ (オプション)	エクスペリメントを識別するためのタグです
作成モード (オプション)	パイプラインがエクスペリメントの作成を試行し、同じ名前のケースが 1 つ存在する場合の処理方法を選択します。 `ignore`、 `fail`、 `overwrite` のいずれかかです

出力パラメーター

パラメーター	説明
AutoAI 時系列エクスペリメント	保存されたモデルへのパス

バッチ・デプロイメントの作成

このノードは、機械学習モデルのバッチ・デプロイメントを作成するために使用します。

入力パラメーター

パラメーター	説明
ML 資産	デプロイする機械学習資産の名前または ID
新規デプロイメント名 (オプション)	新規ジョブの名前と、オプションの説明およびタグ
作成モード (オプション)	パイプラインがジョブを作成しようとして、同じ名前のジョブが 1 つ存在する場合の処理方法。 `ignore`、 `fail`、 `overwrite` のいずれかかです
新規デプロイメントの説明 (オプション)	デプロイメントの説明
新規デプロイメント・タグ (オプション)	デプロイメントを識別するタグ
ハードウェア仕様 (オプション)	ジョブのハードウェア仕様を指定します

出力パラメーター

パラメーター	説明
新しいデプロイメント	新規に作成されたデプロイメントのパス

データ・アセットの作成

このノードは、データ資産を作成するために使用します。

入力パラメーター

パラメーター	説明
ファイル	ファイル・ストレージ内のファイルへのパス
ターゲットのスコープ	ターゲット・スペースまたはプロジェクトへのパス
名前 (オプション)	オプションの説明、原産国、およびタグを含むデータ・ソースの名前
説明 (オプション)	資産の説明
原産国 (オプション)	データ規制のための原産国
タグ (オプション)	資産を識別するためのタグ
作成モード	パイプラインがジョブを作成しようとして、同じ名前のジョブが 1 つ存在する場合の処理方法。 `ignore`、 `fail`、 `overwrite` のいずれかかです

出力パラメーター

パラメーター	説明
データ資産	新しく作成されたデータ資産

デプロイメント・スペースの作成

このノードは、デプロイメントを編成および作成するために使用できるスペースを作成および構成するために使用します。

入力パラメーター

パラメーター	説明
新規スペース名	新規スペースの名前と、オプションの説明およびタグ
新規スペース・タグ (オプション)	スペースを識別するタグ
新規スペース COS インスタンス CRN	COS サービス・インスタンスの CRN
新規スペース WML インスタンス CRN (オプション)	Watson Machine Learning サービス・インスタンスの CRN
作成モード (オプション)	パイプラインがスペースを作成しようとして、同じ名前のスペースが 1 つ存在する場合の処理方法。 `ignore`、 `fail`、 `overwrite` のいずれかかです
スペースの説明 (オプション)	スペースの説明

出力パラメーター

パラメーター	説明
スペース	新規作成されたスペースのパス

オンライン・デプロイメントの作成

このノードは、Web サービス REST API エンドポイントにテスト・データを直接送信できるオンライン・デプロイメントを作成するために使用します。

入力パラメーター

パラメーター	説明
ML 資産	デプロイする機械学習資産の名前または ID
新規デプロイメント名 (オプション)	新規ジョブの名前と、オプションの説明およびタグ
作成モード (オプション)	パイプラインがジョブを作成しようとして、同じ名前のジョブが 1 つ存在する場合の処理方法。 `ignore`、 `fail`、 `overwrite` のいずれかかです
新規デプロイメントの説明 (オプション)	デプロイメントの説明
新規デプロイメント・タグ (オプション)	デプロイメントを識別するタグ
ハードウェア仕様 (オプション)	ジョブのハードウェア仕様を指定します

出力パラメーター

パラメーター	説明
新しいデプロイメント	新規に作成されたデプロイメントのパス

待機

パスで指定されたロケーションで資産が使用可能になるまで、ノードを使用してパイプラインを一時停止します。

このノードは、パイプラインを続行できるように、パイプライン内の前のノードからのすべての結果が使用可能になるまで待機するために使用します。

このノードは入力を行わず、出力を生成しません。結果がすべて使用可能になると、パイプラインは自動的に続行されます。

すべての結果を待機する

このノードは、パイプラインが続行できるように、パイプライン内の前のノードからの結果が使用可能になるまで待機するために使用します。アップストリーム条件のいずれかが満たされるとすぐにダウンストリーム・ノードを実行します。

このノードは入力を行わず、出力を生成しません。結果が使用可能になると、パイプラインは自動的に続行されます。

結果を待機

パイプライン内のジョブまたはプロセスからのパスで指定されたロケーションで、資産が作成または更新されるまで待機します。条件が満たされるまで待機するタイムアウトの長さを指定します。 00:00:00 が指定されたタイムアウトの長さである場合、フローは無期限に待機します。

ファイルを待機

入力パラメーター

パラメーター	説明
ファイルの場所	資産ブラウザーで、資産が存在する場所を指定します。 `data_asset/filename` の形式を使用します。ここで、パスはルートからの相対パスです。ファイルが存在し、指定した場所になければなりません。存在しない場合、ノードはエラーで失敗します。
待機モード	デフォルトでは、ファイルのモードが表示されます。ファイルが表示されなくなるのを待つように変更することができます。
タイムアウトの長さ (オプション)	パイプラインに進む前に待機する時間の長さを指定します。使用する形式 `hh:mm:ss`
エラー・ポリシー (オプション)	エラーの処理を参照してください

出力パラメーター

パラメーター	説明
戻り値	ノードからの戻り値
実行状況	「完了」、「警告付きで完了」、「エラー付きで完了」、「失敗」、または「キャンセル」の値を返します
状況メッセージ	状況に関連付けられたメッセージ

制御ノード

エラー処理とロジックを追加して、パイプラインを制御します。

ループは、コード化されたループのように動作するパイプライン内のノードです。

ループには、並列ループと順次ループの 2 つのタイプがあります。

操作の反復回数が動的である場合は、ループを使用できます。例えば、処理するノートブックの数が分からない場合や、実行時にノートブックの数を選択したい場合は、ループを使用してノートブックのリストを繰り返すことができます。

また、ループを使用して、ノードの出力またはデータ配列内のエレメントを反復することもできます。

並列ループ

パイプラインに並列ループ構文を追加してください。並列ループは、反復ノードを独立して、場合によっては同時に実行します。

例えば、最良の実行者を見つけるために一連のハイパーパラメーターを使用して機械学習モデルをトレーニングするには、ループを使用してハイパーパラメーターのリストを反復処理し、ノートブックのバリエーションを並行してトレーニングすることができます。結果をフローの後の方で比較して、最適なノートブックを見つけることができます。同時に実行できるループの数の制限を確認するには、制限を参照してください。

以下の例では、 「Bash スクリプトの実行 (Run Bash script)」 ノードは、指定された基準に一致するノートブックを検索して取得します。 DataStage ジョブの実行 ノードは、 Git リポジトリーからデータを取得します。各ノードからの入力が使用可能になると、ループ・プロセスが開始され、検索によって取得された各ノートブックが実行され、 Git リポジトリーから取得されたデータが処理されます。

並列ループの例

完全なループ・プロセスを表示するには、 「展開してノードを追加」 またはノード上の発信アイコンをクリックします。ノートブックが実行されると、ノートブック内のすべてのエラーが 「品質が悪い」という条件で取り込まれます。この条件により、Bash スクリプトがトリガーされ、 Increase error countという名前のユーザー変数が増分されます。 Increase error count 変数の値が指定されたしきい値に達すると、ループは終了します。

並列ループの例

フローはノートブックごとに並行して実行されるため、順次ループよりも速く結果を返します。

リスト・タイプを反復するときの入力パラメーター

パラメーター	説明
入力のリスト	List input パラメーターには、リストのデータ型とループが反復するリスト内容の 2 つのフィールド、またはパイプライン入力またはパイプライン出力への標準リンクの 2 つのフィールドが含まれます。
並行処理	同時に実行するタスクの最大数。ゼロより大きくなければなりません

String 型を反復する場合の入力パラメーター

パラメーター	説明
テキスト入力	ループが読み取るテキスト・データ
区切り文字	テキストを分割するために使用される文字
並列処理 (オプション)	同時に実行するタスクの最大数。ゼロより大きくなければなりません

入力配列要素タイプが JSON であるか、または JSON として表されているいずれかのタイプである場合、このフィールドは辞書として分解される可能性があります。キーは元のエレメント・キーであり、値は出力名の別名です。

出力パラメーター

パラメーター	説明
コントロールブレークノードID	ノードが終了したターミネーターノードのノード ID を含む
実行状況	ジョブの状態に関する情報: 保留中、開始中、実行中、完了、キャンセル済み、またはエラーで失敗
状況メッセージ	ジョブの状態に関する情報

シーケンス内のループ

パイプラインに順次ループ構文を追加してください。ループは、数値範囲、リスト、または区切り文字付きのテキストに対して繰り返すことができます。

順次ループのユース・ケースは、操作が失敗したかどうかを判別する 3 回前に操作を試行する場合です。

入力パラメーター

パラメーター	説明
入力のリスト	List input パラメーターには、リストのデータ型とループが反復するリスト内容の 2 つのフィールド、またはパイプライン入力またはパイプライン出力への標準リンクの 2 つのフィールドが含まれます。
テキスト入力	ループが読み取るテキスト・データ。テキストを分割する文字を指定します。
範囲	反復する範囲の開始ステップ、終了ステップ、およびオプション・ステップを指定します。デフォルトのステップは 1 です。

ループ反復範囲を構成した後、ループが完了するまで実行するサブパイプライン・フローをループ内に定義します。例えば、反復ごとにノートブック、スクリプト、またはその他のフローを呼び出すことができます。

出力パラメーター

パラメーター	説明
コントロールブレークノードID	ノードが終了したターミネーターノードのノード ID を含む
実行状況	ジョブの状態に関する情報: 保留中、開始中、実行中、完了、キャンセル済み、またはエラーで失敗
状況メッセージ	ジョブの状態に関する情報

ループの終了

並列ループ・プロセス・フローまたは順次ループ・プロセス・フローでは、 「パイプラインの終了」 ノードを追加して、ループ・プロセスをいつでも終了することができます。契約解除の条件は自分でカスタマイズする必要がある。ノードでは、ループ終了時のステータスをCompleteまたはFailureに変更できる。これにより、ループを完了しても、ループノードが失敗する条件を満たすことができ、パイプラインを継続するか、他のアクションを実行するかを選択できる。

重要: Terminate ループ・ノードを使用すると、ループは進行中のすべてのタスクを取り消し、その反復を完了せずに終了します。

ユーザー変数を設定する

キー / 値のペアを使用してユーザー変数を構成してから、このノードの動的変数のリストを追加します。

ユーザー変数の作成方法について詳しくは、グローバル・オブジェクトの構成を参照してください。

入力パラメーター

表 1. ユーザー変数入力パラメーター
パラメーター	説明
名前	変数の名前またはキーを入力します
入力タイプ	入力タイプとして「式」または「パイプライン・パラメーター」を選択します。

式の場合は、組み込み式ビルダーを使用して、カスタム式の結果として生成される変数を作成します。
パイプライン・パラメーターの場合、パイプライン・パラメーターを割り当て、そのパラメーター値をユーザー変数の入力として使用します。

パイプラインを終了する

「制御」カテゴリーの「パイプラインの終了」ノードを使用して、パイプラインの終了を開始および制御できます。エラー・フローの実行時に、パイプライン内のノードによって開始されたノートブック・ジョブまたはトレーニング・ジョブの処理方法をオプションで指定できます。ジョブの終了を待機するか、ジョブをキャンセルしてパイプラインを停止するか、キャンセルせずにすべてを停止するかを指定する必要があります。「パイプラインの終了」ノードのオプションを指定します。

入力パラメーター

パラメーター	説明
ターミネーター・モード (オプション)	エラー・フローの動作を選択してください

ターミネーター・モードは、以下のいずれかです：

パイプライン実行および実行中のすべてのジョブを終了する ことは、すべてのジョブとパイプラインを停止します。
実行中のすべてのジョブをキャンセルしてからパイプラインを終了 することは、パイプラインを停止する前に、実行中のジョブをすべて取り消します。
実行中のジョブの終了後にパイプライン実行を終了 することは、実行中のジョブが終了するのを待ってから、パイプラインを停止します。
「ジョブを停止せずに実行されるパイプラインを終了する」 は、パイプラインを停止しますが、実行中のジョブは続行できます。

ノードの更新

パフォーマンスを向上させるには、更新ノードを使用して資産を置換または更新します。例えば、タグを標準化する場合、タグを新しいタグに置換するために更新できます。

AutoAI エクスペリメントのトレーニング詳細を更新します。

AutoAI エクスペリメントの更新

入力パラメーター

パラメーター	説明
AutoAI エクスペリメント	エクスペリメントが存在するプロジェクトまたはスペースへのパスです
AutoAI エクスペリメント名 (オプション)	更新されるエクスペリメントの名前と、オプションの説明およびタグ
AutoAI エクスペリメントの説明 (オプション)	エクスペリメントの説明
AutoAI エクスペリメント・タグ (オプション)	エクスペリメントを識別するためのタグです

出力パラメーター

パラメーター	説明
AutoAI エクスペリメント	更新されたエクスペリメントのパス

バッチ・デプロイメントの更新

以下のパラメーターを使用して、バッチ・デプロイメントを更新します。

入力パラメーター

パラメーター	説明
デプロイメント	更新されるデプロイメントへのパス
デプロイメントの新規名 (オプション)	更新されるデプロイメントの名前または ID です
デプロイメントの新規説明 (オプション)	デプロイメントの説明
デプロイメントの新規タグ (オプション)	デプロイメントを識別するタグ
ML 資産	デプロイする機械学習資産の名前または ID
ハードウェア仕様	ジョブのハードウェア仕様を更新します

出力パラメーター

パラメーター	説明
デプロイメント	更新されたデプロイメントのパス

デプロイメント・スペースの更新

スペースの詳細を更新します。

入力パラメーター

パラメーター	説明
スペース	既存のスペースのパス
スペース名 (オプション)	スペース名を更新する
スペースの説明 (オプション)	スペースの説明
スペース・タグ (オプション)	スペースを識別するタグ
WML インスタンス (オプション)	新しい Machine Learning インスタンスを指定します。
WML instance	新しい Machine Learning インスタンスを指定してください。注: UI でインスタンスに別の名前を割り当てた場合でも、システム名は Machine Learning インスタンスになります。インスタンス CRN を使用した異なるインスタンスの区別

出力パラメーター

パラメーター	説明
スペース	更新されたスペースのパス

オンライン・デプロイメントの更新

これらのパラメーターを使用して、オンライン・デプロイメント (Web サービス) を更新します。

入力パラメーター

パラメーター	説明
デプロイメント	既存デプロイメントのパス
デプロイメント名 (オプション)	デプロイメント名を更新する
デプロイメントの説明 (オプション)	デプロイメントの説明
デプロイメント・タグ (オプション)	デプロイメントを識別するタグ
資産 (オプション)	再デプロイされる機械学習資産 (またはバージョン)

出力パラメーター

パラメーター	説明
デプロイメント	更新されたデプロイメントのパス

ノードの削除

削除操作のパラメーターを構成します。

削除

以下を削除できます：

AutoAI エクスペリメント
バッチ・デプロイメント
デプロイメント・スペース
オンライン・デプロイメント

項目ごとに、削除する資産を選択します。

ノードの実行

これらのノードを使用して、エクスペリメントのトレーニング、スクリプトの実行、またはデータ・フローの実行します。

AutoAI エクスペリメントの実行

AutoAI experiment パイプラインおよびモデルをトレーニングし、保管する。

入力パラメーター

パラメーター	説明
AutoAI エクスペリメント	ML パイプライン資産を参照するか、またはパイプライン・パラメーターまたは前のノードからの出力からエクスペリメントを取得します。
トレーニング・データ資産	エクスペリメントをトレーニングするデータを参照または検索します。パイプライン・パラメーターを使用して実行時にデータを提供できることに注意してください。
ホールドアウト・データ資産 (オプション)	オプションで、testingmodel パフォーマンスのホールドアウト・データに使用する別個のファイルを選択します。
モデル数 (オプション)	最もパフォーマンスの良いパイプラインから保存するモデルの数を指定します。制限は 3 つのモデルです
実行名 (オプション)	エクスペリメントの名前と、オプションの説明およびタグ。
モデル名接頭部 (オプション)	トレーニングされたモデルに名前を付けるために使用する接頭部。デフォルトは < (エクスペリメント名)>
実行の説明 (オプション)	新規トレーニング実行の説明
実行タグ (オプション)	新規トレーニング実行のタグ
作成モード (オプション)	パイプライン・フローが資産の作成を試行し、同じ名前の資産が 1 つ存在する場合の処理方法を選択します。 `ignore`、 `fail`、 `overwrite` のいずれかかです
エラー・ポリシー (オプション)	オプションで、ノードのデフォルト・エラー・ポリシーをオーバーライドします。

出力パラメーター

パラメーター	説明
モデル	トレーニングおよび永続化された上位 N 個のモデルのパスのリスト (選択した評価メトリック順)
最適なモデル	最適モデルのパス (選択した評価メトリックに基づく)
モデル・メトリック	トレーニングされたモデル・メトリックのリスト (各項目は、holdout_accuracy、holdout_average_precision などのメトリックを持つネストされたオブジェクトです)
最適モデルのメトリック	最適モデルの選択された評価メトリック
最適化メトリック	モデルの調整に使用されるメトリック
実行状況	ジョブの状態に関する情報: 保留中、開始中、実行中、完了、キャンセル済み、またはエラーで失敗
状況メッセージ	ジョブの状態に関する情報

Bash スクリプトを実行する

インライン Bash スクリプトを実行して、パイプラインの機能またはプロセスを自動化します。 Bash スクリプト・コードを手動で入力することも、リソース、パイプライン・パラメーター、または別のノードの出力から bash スクリプトをインポートすることもできます。

また、Bash スクリプトを使用して、大きな出力ファイルを処理することもできます。例えば、大きなコンマ区切りリストを生成し、それをループを使用して反復することができます。

以下の例では、ユーザーがインライン・スクリプト・コードを手動で入力しました。このスクリプトは、 cpdctl ツールを使用して、設定された変数タグを持つすべてのノートブックを検索し、結果を JSON リストに集約します。このリストは、検索から返されたノートブックの実行など、別のノードで使用できます。

bash スクリプト・ノードの例

入力パラメーター

パラメーター	説明
インライン・スクリプト・コード	インライン・コード・エディターで Bash スクリプトを入力します。オプション: あるいは、リソースを選択したり、パイプライン・パラメーターを割り当てたり、別のノードから選択したりすることもできます。
環境変数 (オプション)	変数名 (キー) とデータ型を指定し、スクリプトで使用する変数のリストに追加します。
ランタイム・タイプ (オプション)	スタンドアロン・ランタイム (デフォルト) または共有ランタイムのいずれかを選択します。共有ポッドで実行する必要があるタスクには、共有ランタイムを使用します。
エラー・ポリシー (オプション)	オプションで、ノードのデフォルト・エラー・ポリシーをオーバーライドします。

出力パラメーター

パラメーター	説明
出力変数	カスタム変数ごとにキー/値のペアを構成し、「追加」ボタンをクリックして、ノードの動的変数のリストにデータを取り込みます。
戻り値	ノードからの戻り値
標準出力	スクリプトからの標準出力
標準誤差	スクリプトからの標準エラー・メッセージ
実行状況	ジョブの状態に関する情報: 保留中、開始中、実行中、完了、キャンセル済み、またはエラーで失敗
状況メッセージ	状況に関連付けられたメッセージ

Bash スクリプト出力のルール

多くの場合、Bash スクリプトの出力は計算式の結果であり、大きくなる可能性があります。有効な大きい出力を持つスクリプトのプロパティーを確認するときに、ビューアーで出力をプレビューまたはダウンロードできます。

これらの規則は、どのタイプの大容量出力が有効であるかを制御します。

list_expression の出力は計算式であるため、大容量の出力として有効です。
ストリング出力は、計算式ではなくリテラル値として扱われるため、インライン式を管理するサイズ制限に従う必要があります。例えば、リテラル値が 1 KB を超え、値が 2 KB 以上の場合にエラーが発生すると、警告が出されます。
例えば、 GetCommandOutput 関数を使用して、標準エラー・メッセージを標準出力 (standard_output) に組み込み、それらを表示することができます。

Bash スクリプトでの変数の参照

スクリプトで変数を参照する方法は、変数が入力変数として作成されたか出力変数として作成されたかによって異なります。出力変数はファイルとして作成され、参照にはファイル・パスが必要です。具体的には、

入力変数は、割り当てられた名前を使用して使用できます。
出力変数名では、 {output_name}_PATH 変数が指す出力ファイルに値を書き込む必要があることを示すために、変数名 _PATH にを付加する必要があります。

バッチ・デプロイメントの実行

選択したデプロイメント・ジョブを実行するようにこのノードを構成します。

入力パラメーター

パラメーター	説明
デプロイメント	デプロイメント・ジョブを参照または検索します
入力データ資産	バッチ・ジョブに使用されるデータを指定します。制約事項: バッチ・デプロイメント・ジョブの入力は、データ資産に限定されます。 JSON 入力を必要とするデプロイメント、または入力として複数のファイルを必要とするデプロイメントはサポートされません。例えば、入力として複数のファイルを必要とする SPSS モデルおよび Decision Optimization ソリューションはサポートされていません。
出力資産	バッチ・ジョブの結果の出力ファイルの名前。「ファイル名」を選択してカスタム・ファイル名を入力するか、「データ資産」を選択してスペース内の既存の資産を選択することができます。
ハードウェア仕様 (オプション)	ジョブに適用するハードウェア仕様を参照します
エラー・ポリシー (オプション)	オプションで、ノードのデフォルト・エラー・ポリシーをオーバーライドします。

出力パラメーター

パラメーター	説明
ジョブ	デプロイメント・ジョブの結果を含むファイルへのパス。
ジョブ実行	ジョブの ID
実行状況	ジョブの状態に関する情報: 保留中、開始中、実行中、完了、キャンセル済み、またはエラーで失敗
状況メッセージ	ジョブの状態に関する情報

IBM DataStage は、データの移動と変換を行うジョブを設計、開発、実行するためのデータ統合ツールです。 DataStage ジョブを実行し、後のノードで出力を使用します。

例えば、以下のフローは、 Git リポジトリーからデータを取得する 「 DataStageの実行」 ノードを示しています。ジョブが正常に完了すると、パイプラインは次のノードを実行し、デプロイメント・スペースを作成します。ジョブが失敗すると、通知 E メールがトリガーされ、ループが終了します。

パイプラインでの DataStage ジョブの実行

パラメーター	説明
DataStageジョブ	DataStage ジョブへのパス
ローカル・パラメーターの値 (オプション)	デフォルトのジョブ・パラメーターを編集します。このオプションは、ジョブにローカル・パラメーターがある場合にのみ使用可能です。
パラメーター・セットからの値 (オプション)	このジョブで使用されるパラメーター・セットを編集します。デフォルトで定義されているパラメーターを使用するか、他のパイプラインのパラメーターからの値セットを使用するかを選択できます。
環境	DataStage ジョブの実行に使用される環境を見つけて選択します。重要: 環境フィールドは、デフォルトの DataStage XS ランタイムを使用するようにそのままにしてください。オーバーライドを選択する場合は、ジョブを実行するための代替環境を指定します。ランタイム・エラーを回避するために、指定する環境がハードウェア構成と互換性があることを確認してください。
環境変数 (オプション)	変数名 (キー) とデータ型を指定し、ジョブで使用する変数のリストに追加します。
ジョブ・パラメーター (オプション)	ジョブの実行時にジョブに渡す追加パラメーター。キー/値のペアを指定し、リストに追加します。注: ローカル・パラメーター `DSJobInvocationId` が使用されている場合、その値はジョブ詳細ダッシュボードでジョブ名として渡されます。
エラー・ポリシー (オプション)	オプションで、ノードのデフォルト・エラー・ポリシーをオーバーライドします。

出力パラメーター

パラメーター	説明
ジョブ	DataStage ジョブからの結果へのパスです
ジョブ実行	ジョブ実行に関する情報
ジョブ名	ジョブの名前
実行状況	ジョブの状態に関する情報: 保留中、開始中、実行中、完了、キャンセル済み、またはエラーで失敗
状況メッセージ	ジョブの状態に関する情報

Data Refinery ジョブの実行

このノードは、指定された Data Refinery ジョブを実行します。

入力パラメーター

パラメーター	説明
Data Refinery ジョブ	Data Refinery ジョブへのパス。
環境	ジョブの実行に使用される環境のパス重要: 環境フィールドはそのままにして、デフォルトのランタイムを使用します。オーバーライドを選択する場合は、ジョブを実行するための代替環境を指定します。ランタイム・エラーを回避するために、指定する環境がコンポーネント言語およびハードウェア構成と互換性があることを確認してください。
エラー・ポリシー (オプション)	オプションで、ノードのデフォルト・エラー・ポリシーをオーバーライドします。

出力パラメーター

パラメーター	説明
ジョブ	Data Refinery ジョブの結果へのパス
ジョブ実行	ジョブ実行に関する情報
ジョブ名	ジョブの名前
実行状況	フローの状態に関する情報: 保留中、開始中、実行中、完了、キャンセル済み、またはエラー付きで失敗
状況メッセージ	フローの状態に関する情報

Notebook ジョブの実行

これらの構成オプションを使用して、パイプラインでの Jupyter Notebook の実行方法を指定します。

入力パラメーター

パラメーター	説明
ノートブック・ジョブ	ノートブック・ジョブへのパス。
環境	ノートブックの実行に使用される環境のパス。重要: environments フィールドは、デフォルト環境を使用するためにそのままにしておきます。オーバーライドを選択する場合は、ジョブを実行するための代替環境を指定します。ランタイム・エラーを回避するために、指定する環境がノートブック言語およびハードウェア構成と互換性があることを確認してください。
環境変数 (オプション)	ノートブック・ジョブの実行に使用される環境変数のリスト
エラー・ポリシー (オプション)	オプションで、ノードのデフォルト・エラー・ポリシーをオーバーライドします。

注:

パイプラインで定義した環境変数は、オーケストレーション・パイプラインの外部で実行するノートブック・ジョブには使用できません。
ノートブックは、通常のパッケージのコード・パッケージから実行できます。

出力パラメーター

パラメーター	説明
ジョブ	ノートブック・ジョブからの結果へのパス
ジョブ実行	ジョブ実行に関する情報
ジョブ名	ジョブの名前
出力変数	カスタム変数ごとにキー/値のペアを構成し、「追加」をクリックしてノードの動的変数のリストにデータを取り込みます。
実行状況	実行の状態に関する情報: 保留中、開始中、実行中、完了、キャンセル済み、またはエラーで失敗
状況メッセージ	ノートブック実行の状態に関する情報

パイプライン・コンポーネントの実行

Python スクリプトを使用して作成された再使用可能なパイプライン・コンポーネントを実行します。詳しくは、カスタム・コンポーネントの作成を参照してください。

パイプライン・コンポーネントが使用可能な場合、ノードを構成すると、使用可能なコンポーネントのリストが表示されます。
選択するコンポーネントは、ノードの入出力を指定します。
コンポーネントをノードに割り当てた後は、そのコンポーネントを削除したり変更したりすることはできません。ノードを削除して、新しいノードを作成する必要があります。

パイプライン・ジョブの実行

ネストされたパイプライン・ジョブを収容パイプラインの一部として実行するには、パイプラインを追加します。これは、再使用可能なプロセスを複数のパイプラインに追加する方法です。包含パイプライン内のノードの入力として実行される、ネストされたパイプラインからの出力を使用できます。

入力パラメーター

パラメーター	説明
パイプライン・ジョブ	既存のパイプライン・ジョブへのパスを選択または入力します。
環境 (オプション)	パイプライン・ジョブを実行する環境を選択し、環境リソースを割り当てます。重要: 環境フィールドはそのままにして、デフォルトのランタイムを使用します。オーバーライドを選択する場合は、ジョブを実行するための代替環境を指定します。ランタイム・エラーを回避するために、指定する環境がコンポーネント言語およびハードウェア構成と互換性があることを確認してください。
ジョブ実行名 (オプション)	カスタム・ジョブ実行名を指定してオーバーライドしない限り、デフォルトのジョブ実行名が使用されます。「ジョブの詳細」ダッシュボードでジョブ実行名を確認できます。
ローカル・パラメーターの値 (オプション)	デフォルトのジョブ・パラメーターを編集します。このオプションは、ジョブにローカル・パラメーターがある場合にのみ使用可能です。
パラメーター・セットからの値 (オプション)	このジョブで使用されるパラメーター・セットを編集します。デフォルトで定義されているパラメーターを使用するか、他のパイプラインのパラメーターからの値セットを使用するかを選択できます。
エラー・ポリシー (オプション)	オプションで、ノードのデフォルト・エラー・ポリシーをオーバーライドします。

出力パラメーター

パラメーター	説明
ジョブ	パイプライン・ジョブからの結果へのパス
ジョブ実行	ジョブ実行に関する情報
ジョブ名	ジョブの名前
実行状況	「完了」、「警告付きで完了」、「エラー付きで完了」、「失敗」、または「キャンセル」の値を返します
状況メッセージ	状況に関連付けられたメッセージ

ネストされたパイプライン・ジョブの実行に関する注意事項

ネストされたパイプラインを使用してパイプラインを作成し、最上位からパイプライン・ジョブを実行すると、パイプラインの名前が付けられ、以下の規則を使用するプロジェクト資産として保存されます。

最上位のパイプライン・ジョブの名前は「試用版ジョブ- pipeline guid」です。
後続のすべてのジョブには、「pipeline_ pipeline guid」という名前が付けられます。

SPSS Modeler ジョブの実行

これらの構成オプションを使用して、パイプラインでの SPSS Modeler の実行方法を指定します。

入力パラメーター

パラメーター	説明
SPSS Modeler ジョブ	既存の SPSS Modeler ジョブのパスを選択または入力します。
環境 (オプション)	SPSS Modeler ジョブを実行する環境を選択し、環境リソースを割り当てます。重要: 「環境」フィールドはそのままにして、デフォルトの SPSS Modeler ランタイムを使用します。オーバーライドを選択する場合は、ジョブを実行するための代替環境を指定します。ランタイム・エラーを回避するために、指定する環境がハードウェア構成と互換性があることを確認してください。
ローカル・パラメーターの値	デフォルトのジョブ・パラメーターを編集します。このオプションは、ジョブにローカル・パラメーターがある場合にのみ使用可能です。
エラー・ポリシー (オプション)	オプションで、ノードのデフォルト・エラー・ポリシーをオーバーライドします。

出力パラメーター

パラメーター	説明
ジョブ	パイプライン・ジョブからの結果へのパス
ジョブ実行	ジョブ実行に関する情報
ジョブ名	ジョブの名前
実行状況	「完了」、「警告付きで完了」、「エラー付きで完了」、「失敗」、または「キャンセル」の値を返します
状況メッセージ	状況に関連付けられたメッセージ

親トピック: パイプラインの作成