クイックスタートパイプラインでモデルのライフサイクルを自動化する
エンド・ツー・エンドのパイプラインを作成し、外部データソースに保存されている簡潔で前処理済みの最新データを配信することができます。 オーケストレーション・パイプラインについて読んで、ビデオを見て、チュートリアルを受けてください。
- 必須のサービス
- Watson Studio
- Watson Machine Learning
基本的なワークフローには、以下のタスクが含まれます:
- サンドボックスプロジェクトを開く。 プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
- 接続とデータをプロジェクトに追加する。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
- プロジェクトにパイプラインを作成する。
- パイプラインにノードを追加してタスクを実行する。
- パイプラインを実行し、結果を見る。
パイプラインについて読む
Pipelinesエディタは、アセットの作成からデプロイまでのエンドツーエンドのフローをオーケストレーションするためのグラフィカルなインターフェイスを提供します。 機械学習モデルおよび Python スクリプトを作成、トレーニング、デプロイ、および更新するためのパイプラインをアセンブルおよび構成します。 モデルを生産に移すには、複数の段階を踏む必要がある。 データをロードし、処理し、モデルをトレーニングし、チューニングしてから配備し、テストしなければならない。 機械学習モデルでは、バイアスやドリフトを回避するために、時間の経過に伴い、さらに観測、評価、および更新が必要になります。
パイプラインに関するビデオを見る
このチュートリアルのステップをプレビューするには、このビデオをご覧ください。 ビデオで紹介されているユーザー・インターフェースに若干の違いがあることに気づくかもしれない。 このビデオは、書面でのチュートリアルに付随するものです。
このビデオは、このドキュメントのコンセプトとタスクを学ぶための視覚的な方法を提供します。
パイプラインを使ってモデルを作成するチュートリアルを試す
このチュートリアルでは、AIパイプラインを探索して実行し、モデルを構築してデプロイする方法を説明します。 このモデルは、マーケティング・キャンペーンに基づいて、顧客が定期預金に加入する可能性があるかどうかを予測する。
このチュートリアルでは、以下のタスクを実行します:
- タスク1:プロジェクトを開く。
- タスク2:デプロイメントスペースを作成する
- タスク3:サンプルパイプラインの作成
- タスク4:既存のパイプラインを調査する
- タスク5:パイプラインの実行
- タスク6:アセット、デプロイされたモデル、およびオンラインデプロイメントを表示する
このチュートリアルの所要時間は約30分。
サンプルデータ
ガイド付きエクスペリエンスで使用されるサンプルデータは、UCI:顧客がマーケティングプロモーションに登録するかどうかを予測するために使用される銀行のマーケティングデータです。
このチュートリアルを完了するためのヒント
このチュートリアルを成功させるためのヒントを紹介します。
ビデオのピクチャー・イン・ピクチャーを使う
次のアニメーション画像は、ビデオのピクチャー・イン・ピクチャーと目次機能の使い方を示しています:
地域の助けを借りる
このチュートリアルで助けが必要な場合は、watsonx コミュニティ ディスカッション フォーラムで質問したり、答えを見つけることができます。
ブラウザのウィンドウを設定する
このチュートリアルを最適に完了するには、Cloud Pak for Data を 1 つのブラウザ ウィンドウで開き、このチュートリアルのページを別のブラウザ ウィンドウで開いておくと、2 つのアプリケーションを簡単に切り替えることができます。 2つのブラウザウィンドウを横に並べると、より見やすくなります。
タスク 1:プロジェクトを開く
Prompt Labのアセットを保存するプロジェクトが必要です。
サンドボックスプロジェクトを作成し、サービスを関連付ける方法をビデオでご覧ください。 次に、既存のプロジェクトを確認するか、サンドボックス・プロジェクトを作成する手順に従ってください。
このビデオは、このドキュメントのコンセプトとタスクを学ぶための視覚的な方法を提供します。
watsonx ホーム画面で、プロジェクト セクションまでスクロールします。 プロジェクトが表示されている場合は、タスク2に進んでください。 プロジェクトが表示されない場合は、以下の手順に従ってプロジェクトを作成してください。
サンドボックスプロジェクトを作成をクリックします。 プロジェクトが作成されると、プロジェクトセクションにサンドボックスプロジェクトが表示されます。
詳細やビデオについては、プロジェクトの作成をご覧ください。
進捗状況を確認する
次の画像は、Projectsセクションにサンドボックスが表示されているホーム画面です。 これでプロンプト・ラボを開く準備ができました。
タスク2:デプロイメントスペースの作成
このタスクをプレビューするには、00:16から始まるビデオを見てください。
デプロイメントスペースでは、入力データや環境などのサポートリソースを整理したり、モデルや関数をデプロイして予測やソリューションを生成したり、デプロイの詳細を表示または編集したりすることができます。 以下の手順に従って、配置スペースを作成してください。
watsonx のナビゲーション・メニュー から、Deployments を選択します。 既存の展開領域がある場合は、タスク 2 に進むことができます。
新規デプロイメント・スペースをクリックしてください。
配置スペースの名前を入力します。
リストからストレージ・サービスを選択します。
プロビジョニングされた機械学習サービスをリストから選択する。
「作成」 をクリックします。
進捗状況を確認する
以下の画像は、空の配置スペースを示している
タスク3:サンプル・パイプラインの作成
このタスクをプレビューするには、00:08から始まるビデオを見てください。
プロジェクト内でパイプラインを作成し、実行する。 以下の手順に従って、プロジェクトのサンプルを基にパイプラインを作成してください:
watsonx ホームページで、ドロップダウン リストからサンドボックスまたは別の既存のプロジェクトを選択します。
旅をカスタマイズするをクリックし、すべてのタスクを表示するを選択します。
モデルのライフサイクルを自動化を選択します。
リソースハブサンプルをクリックします。
Orchestrate an AutoAI experimentを選択し、Nextをクリックします。
オプション:パイプラインの名前を変更する。
「作成」 をクリックします。 サンプルパイプラインはトレーニングデータを取得し、AutoAI ツールを使用して機械学習モデルをトレーニングし、最適なパイプラインを選択してモデルとして保存します。 モデルは空間に配置される。
進捗状況を確認する
以下の画像はサンプルパイプラインです
タスク4:既存のパイプラインの調査
このタスクをプレビューするには、00:30から始まるビデオを見てください。
サンプルパイプラインには、アセットを作成し、それらのアセットを使用してモデルを構築するためのノードがいくつか含まれています。 ノードを表示するには、以下の手順に従ってください:
グローバルオブジェクトアイコンをクリックすると、パイプラインのパラメータが表示されます。 deployment_spaceパラメーターを展開します。 このパイプラインには、AutoAI 実験の最良のモデルが格納され、デプロイされるデプロイメント空間を指定するパラメータがあります。 Xをクリックしてウィンドウを閉じる。
Create data file ノードをダブルクリックして、実験用のデータセットにアクセスするように設定されていることを確認する。 キャンセルをクリックしてプロパティペインを閉じます。
Create AutoAI実験ノードをダブルクリックします。 実験名、スコープ(実験が保存されている場所)、予測タイプ(バイナリ分類、マルチクラス分類、回帰)、予測カラム、ポジティブクラスを表示します。 残りのパラメーターはすべてオプションである。 キャンセルをクリックしてプロパティペインを閉じます。
Run AutoAI experimentノードをダブルクリックします。 このノードはAutoAI実験onboarding-bank-marketing-predictionを実行し、パイプラインを訓練し、最適なモデルを保存します。 最初の2つのパラメータは必須である。 最初のパラメータは、Create AutoAI実験ノードの出力を入力として実験を実行する。 2番目のパラメータは、データファイルの作成ノードからの出力を実験のトレーニングデータ入力として使用します。 残りのパラメーターはすべてオプションである。 Cancelをクリックしてプロパティペインを閉じます。
Webサービスを作成ノードをダブルクリックします。 このノードは
onboarding-bank-marketing-prediction-deployment
という名前のデプロイメントを作成します。 最初のパラメータは、Run AutoAI実験ノードからの最良のモデル出力を入力として、指定された名前のデプロイメントを作成します。 残りのパラメーターはすべてオプションである。 キャンセルをクリックしてプロパティペインを閉じます。
進捗状況を確認する
次の図は、「Create Web service」ノードのプロパティを示しています。 これでサンプルのパイプラインを実行する準備ができました。
タスク5:パイプラインの実行
このタスクをプレビューするには、03:43から始まるビデオを見てください。
パイプラインが完成したので、以下の手順に従ってパイプラインを実行します:
ツールバーから、Run pipeline > Trial runをクリックします。
パイプラインパラメータの値セクションで、デプロイメントスペースを選択します:
セレクトスペースをクリックします。
スペースをクリックします。
タスク1から配置スペースを選択します。
選択をクリックします。
初めてパイプラインを実行する場合は、APIキーを入力してください。 パイプライン アセットは、個人の IBM Cloud API キーを使用して、業務を中断することなく安全に実行します。
既存のAPIキーをお持ちの場合は、Use existing API keyをクリックし、APIキーを貼り付け、Saveをクリックします。
既存のAPIキーがない場合は、Generate new API keyをクリックして名前を入力し、Saveをクリックします。 APIキーをコピーし、将来の使用のためにAPIキーを保存する。 終わったら、閉じるをクリックする。
実行をクリックしてパイプラインの実行を開始します。
パイプラインの進捗状況を監視する。
パイプラインの実行中に連結ログをスクロールする。 試運転には10分ほどかかる場合がある。
各操作が完了したら、キャンバス上でその操作のノードを選択する。
Node Inspectorタブで、操作の詳細を表示します。
ノード出力タブをクリックすると、各ノード操作の出力の概要が表示されます。
進捗状況を確認する
次の画像は、試運転を終えたパイプラインである。
パイプラインが作成したアセットを確認する準備ができました
タスク6:アセット、デプロイ済みモデル、オンラインデプロイメントの表示
このタスクをプレビューするには、04:27から始まるビデオをご覧ください。
パイプラインは配備スペースにいくつかの資産を生み出した。 資産を見るには、以下の手順に従ってください:
watsonx のナビゲーション・メニュー から、Deployments を選択します。
配置スペースの名前をクリックします。
資産タブで、すべての資産を表示します。
bank-marketing-data.csv データ資産をクリックします。 データファイルの作成ノードがこのアセットを作成しました。
onboarding-bank-marketing-predictionという名前で始まるモデルをクリックします。 Run AutoAI実験ノードはいくつかのモデル候補を生成し、これを最良のモデルとして選んだ。
モデルの詳細タブをクリックし、モデルとトレーニング情報をスクロールします。
Deploymentsタブをクリックし、onboarding-bank-marketing-prediction-deploymentを開きます。
テストタブをクリックします。
JSON入力タブをクリックします。
サンプル・テキストを以下のJSONテキストに置き換え、予測をクリックします。
{ "input_data": [ { "fields": [ "age", "job", "marital", "education", "default", "balance", "housing", "loan", "contact", "day", "month", "duration", "campaign", "pdays", "previous", "poutcome" ], "values": [ [ 35, "management", "married", "tertiary", "no", 0, "yes", "no", "cellular", 1, "jun", 850, 10, -1, 4, "unknown" ] ] } ] }
進捗状況を確認する
次の画像はテストの結果で、予測は申請者を承認するものである。
あなたのテストの信頼スコアは、画像に表示されているスコアとは異なるかもしれない
次のステップ
模型を作る他の方法を試してみよう:
詳しくは、 ビデオを参照してください。
サンプルデータセット、プロジェクト、モデル、プロンプト、ノートブックをリソースハブで見つけて、実践的な経験を積むことができます:
ノートブックをプロジェクトに追加して、データの分析やモデルの構築を始めることができます。
ノートブック、データセット、プロンプト、およびその他の資産を含むインポート可能なプロジェクト。
データセットをプロジェクトに追加して、モデルを改良、分析、構築することができます。
プロンプト 。プロンプト・ラボで基盤モデルのプロンプトを出すために使用できます。
プロンプト・ラボで使用できる 基盤モデル 。
詳細情報
親トピック: クイック・スタート・チュートリアル