サンプル・データを使用する組み込みのサンプル・パイプラインを表示および実行して、Orchestration Pipelines で機械学習フローを自動化する方法を学習できます。
サンプル・パイプラインで何が起こっていますか?
サンプル・パイプラインは、トレーニング・データを取得し、 AutoAI ツールを使用して機械学習モデルをトレーニングし、モデルとして保存する最適なパイプラインを選択します。 その後、モデルは、デプロイ先のデプロイメント・スペースにコピーされます。
このサンプルは、ライフサイクルを実行およびモニターしやすくするためにエンドツーエンド・フローを自動化する方法を示しています。
サンプル・パイプラインは次のようになります。
チュートリアルでは、以下のプロセスのステップを説明しています。
前提条件
このサンプルを実行するには、まず以下を作成する必要があります。
- プロジェクト。ここで、サンプル・パイプラインを実行できます。
- デプロイメント・スペース。結果を表示およびテストできます。 サンプル・パイプラインを実行するには、デプロイメント・スペースが必要です。
サンプル・パイプラインの作成と実行のプレビュー
サンプル・パイプラインを作成して実行する方法を確認するには、このビデオをご覧ください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
サンプル・パイプラインの作成
パイプライン・エディターでサンプル・パイプラインを作成します。
パイプラインを作成したいプロジェクトを開きます。
「アセット」 タブで、 「新規アセット」>「モデル・ライフサイクルの自動化」をクリックします。
「リソース・ハブのサンプル (Resource hub sample)」 タブをクリックし、 「 AutoAI エクスペリメントのオーケストレーション」を選択します。
パイプラインの名前を入力します。 例えば、 Bank marketing sampleと入力します。
「作成」 をクリックして、キャンバスを開きます。
サンプル・パイプラインの実行
サンプル・パイプラインを実行するには:
キャンバス・ツールバーの 「パイプラインの実行 (Run pipeline)」 をクリックし、 「試行実行 (Trial run)」を選択します。
deployment_space パイプライン・パラメーターの値を指定するようにプロンプトが出されたら、デプロイメント・スペースを選択します。
「スペースの選択」をクリックします。
「スペース」 セクションを展開します。
デプロイメント・スペースを選択します。
「選択」をクリックします。
パイプラインを初めて実行する場合は、API キーを指定します。 パイプライン資産は、お客様の個人の IBM Cloud API キーを使用して、中断することなく安全に操作を実行します。
既存の API キーがある場合は、 「既存の API キーを使用」をクリックし、API キーを貼り付け、 「保存」をクリックします。
既存の API キーがない場合は、 「新規 API キーの生成」をクリックし、名前を指定して 「保存」をクリックします。 API キーをコピーして、後で使用するために保存します。 完了したら、 「閉じる」をクリックします。
実行 をクリックしてパイプラインを開始します。
結果の確認
パイプラインの実行が完了すると、出力を表示して結果を確認できます。
パイプラインの一部として指定したデプロイメント・スペースを開きます。 スペースに新しいデプロイメントが表示されます。
デプロイメントをテストする場合は、デプロイメント・スペースの 「テスト」 ページを使用して JSON 形式のペイロード・データを送信し、スコアを取得します。 例えば、 「JSON」 タブをクリックして、以下の入力データを入力します。
{"input_data": [{"fields": ["age","job","marital","education","default","balance","housing","loan","contact","day","month","duration","campaign","pdays","previous","poutcome"],"values": [["30","unemployed","married","primary","no","1787","no","no","cellular","19","oct","79","1","-1","0","unknown"]]}]}
「予測 (Predict)」をクリックすると、モデルは、顧客が定期預金プロモーションをサブスクライブしているかどうかの予測の信頼性スコアを含む出力を生成します。
この場合、「いいえ」の予測には 95% 近くの信頼性スコアが付随し、お客様が定期預金に加入しない可能性が最も高いと予測されます。
サンプル・ノードおよび構成の探索
以下のステップを使用して、パイプライン・サンプルで連携するようにサンプル・ノードがどのように構成されているかをより深く理解します。
- パイプライン・パラメーターの表示
- AutoAI エクスペリメントのトレーニング・データのロード
- AutoAI エクスペリメントの作成
- AutoAI エクスペリメントの実行
- Web サービスへのモデルのデプロイ
パイプライン・パラメーターの表示
パイプライン・パラメーターは、パイプライン全体の設定を指定します。 サンプル・パイプラインでは、パイプライン・パラメーターを使用して、 AutoAI エクスペリメントから保存されたモデルが保管およびデプロイされるデプロイメント・スペースを指定します。 パイプライン・パラメーターのリンク先のデプロイメント・スペースを選択するように求めるプロンプトが出されます。
キャンバス・ツールバーのグローバル・オブジェクト・アイコン をクリックして、パイプライン・パラメーターを表示または作成します。 サンプル・パイプラインでは、パイプライン・パラメーターの名前は deployment_space で、タイプは Spaceです。 パイプライン・パラメーターの名前をクリックして、詳細を表示します。 このサンプルでは、 データ・ファイルの作成 ノードと AutoAI エクスペリメントの作成 ノードでパイプライン・パラメーターが使用されています。
AutoAI エクスペリメントのトレーニング・データのロード
このステップでは、テスト用のデータ・セットにアクセスするように データ・ファイルの作成 ノードが構成されます。 ノードをクリックして、構成を表示します。 データ・ファイルは bank-marketing-data.csv
です。これは、銀行の顧客が定期預金に登録しているかどうかを予測するためのサンプル・データを提供します。 データは Cloud Object Storage バケットに保存され、モデルのトレーニングを最新の状態に保つために更新できます。
オプション | 値 |
---|---|
ファイル | AutoAI エクスペリメントをトレーニングするためのデータ資産の場所。 この場合、データ・ファイルはプロジェクト内にあります。 |
ファイル・パス | 資産の名前 ( bank-marketing-data.csv )。 |
ターゲットのスコープ | このサンプルでは、ターゲットはデプロイメント・スペースです。 |
AutoAI エクスペリメントの作成
AutoAI エクスペリメントを作成 するノードは、以下の値で構成されます:
オプション | 値 |
---|---|
AutoAI エクスペリメント名 | onboarding-bank-marketing-prediction |
範囲 | このサンプルでは、ターゲットはデプロイメント・スペースです。 |
予測タイプ | 2 進 |
予測列 (ラベル) | y |
ポジティブ・クラス | はい |
トレーニング・データ分割率 | 0.9 |
含めるアルゴリズム | GradientBoostingClassifierEstimator XGBClassifierEstimator |
使用するアルゴリズム | 1 |
最適化するメトリック | ROC AUC |
メトリックの最適化 (オプション) | デフォルト |
ハードウェア仕様 (オプション) | デフォルト |
AutoAI エクスペリメントの説明 | このテストでは、サンプル・ファイルを使用します。このファイルには、マーケティング・キャンペーンに対応してポルトガルの銀行への電話から収集されたテキスト・データが含まれています。 分類の目標は、クライアントが定期預金 (変数 y で表される) をサブスクライブするかどうかを予測することです。 |
AutoAI エクスペリメント・タグ (オプション) | 無し |
作成モード (オプション) | デフォルト |
これらのオプションは、銀行のマーケティング・データを使用して、顧客がプロモーションに参加する可能性があるかどうかを予測するテストを定義します。
AutoAI エクスペリメントの実行
このステップでは、 AutoAI エクスペリメントの実行 ノードが AutoAI エクスペリメント onboarding-bank-marketing-predictionを実行し、パイプラインをトレーニングしてから、最適なモデルを保存します。
オプション | 値 |
---|---|
AutoAI エクスペリメント | Create AutoAI ノードからの出力を、エクスペリメントを実行するための入力として取得します。 |
トレーニング・データ資産 | 「データ・ファイルの作成」 ノードからの出力をエクスペリメントのトレーニング・データ入力として取得します。 |
モデル数 | 1 |
モデル数 (オプション) | 3 |
ホールドアウト・データ資産 (オプション) | 無し |
実行名 (オプション) | 無し |
モデル名接頭部 (オプション) | 無し |
実行の説明 (オプション) | 無し |
実行タグ (オプション) | 無し |
作成モード (オプション) | デフォルト |
エラー・ポリシー (オプション) | デフォルト |
Web サービスへのモデルのデプロイ
「Web デプロイメントの作成」 ノードは、 onboarding-bank-marketing-prediction-deployment という名前のオンライン・デプロイメントを作成します。これにより、データを配信し、REST API エンドポイントからリアルタイムで予測を取得できます。
オプション | 値 |
---|---|
ML 資産 | デプロイメントを作成するための入力として、 「 AutoAI」 ノードから最適なモデル出力を取得します。 |
デプロイメント名 (Deployment name) | onboarding-bank-marketing-prediction-deployment |
親トピック: IBM Orchestration パイプライン