クイック・スタート: AutoAI を使用して機械学習モデルを作成とデプロイする
AutoAI ツールを使用して、機械学習モデルの作成プロセスを自動化できます。 AutoAI ツールについて読み、ビデオを見て初心者向けのチュートリアルを受けます。コーディングは必要ありません。
基本的なワークフローには、以下のタスクが含まれます:
- サンドボックス・プロジェクトを開きます。 プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
- データをプロジェクトに追加します。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
- プロジェクトで AutoAI エクスペリメントを作成します。
- モデル・パイプラインを確認し、デプロイするモデルとして、またはカスタマイズするノートブックとして、目的のパイプラインを保存します。
- モデルをデプロイしてテストします。
AutoAI について読む
AutoAI グラフィック・ツールは、データを自動的に分析し、予測モデリングの問題に合わせてカスタマイズされた候補モデル・パイプラインを生成します。 これらのモデル・パイプラインは、AutoAI がデータ・セットを分析し、問題設定に最適なデータ変換、アルゴリズム、およびパラメーター設定を検出するときに、繰り返し作成されます。 結果はリーダーボードに表示され、自動的に生成されたモデル・パイプラインが、ユーザーの問題最適化目標に従ってランク付けされた順序で示されます。
AutoAI を使用してモデルの作成に関するビデオを見る
このビデオを見て、銀行マーケティング・サンプルに基づいて AutoAI エクスペリメントを作成して実行する方法を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
AutoAI を使用してチュートリアルを受けてモデルを作成する
このチュートリアルでは、マーケティング・キャンペーンに基づいて顧客が定期預金をサブスクライブする可能性があるかどうかを予測するためのモデルのトレーニングについて説明します。
このチュートリアルでは、以下のタスクを実行します:
- タスク 1: プロジェクトを開きます。
- タスク 2: モデルの作成とトレーニング。
- タスク 3: モデルをデプロイメント・スペースにプロモートし、トレーニング済みモデルをデプロイする
- タスク 4: デプロイされたモデルをテストします。
- タスク 5: モデルをスコアリングするためのバッチ・ジョブを作成します。
このチュートリアルを完了するための所要時間は約 30 分です。
サンプルデータ
ガイド付きエクスペリエンスで使用されるサンプル・データは、UCI: 顧客がマーケティング・プロモーションに登録するかどうかを予測するために使用される銀行マーケティング・データです。
このチュートリアルを完了するためのヒント
このチュートリアルを正常に完了するためのヒントを以下に示します。
ビデオ・ピクチャー・イン・ピクチャーの使用
以下のアニメーション・イメージは、ビデオ・ピクチャー・イン・ピクチャーおよび目次機能の使用方法を示しています。
コミュニティーでのヘルプの利用
このチュートリアルでヘルプが必要な場合は、 watsonx コミュニティー・ディスカッション・フォーラムで質問したり、回答を見つけたりすることができます。
ブラウザー・ウィンドウのセットアップ
このチュートリアルを最適に実行するには、1 つのブラウザー・ウィンドウで Cloud Pak for Data を開き、このチュートリアル・ページを別のブラウザー・ウィンドウで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。 2 つのブラウザー・ウィンドウを横並びに配置して、見やすくすることを検討してください。
タスク 1: プロジェクトを開く
データおよび AutoAI エクスペリメントを保管するためのプロジェクトが必要です。 サンドボックス・プロジェクトを使用することも、プロジェクトを作成することもできます。
ナビゲーション・メニュー から、 「プロジェクト」>「すべてのプロジェクトを表示」 を選択します。
サンドボックス・プロジェクトを開きます。 新規プロジェクトを使用する場合は、以下のようにします。
新規プロジェクトをクリックしてください。
「空のプロジェクトの作成」を選択します。
プロジェクトの名前と説明 (オプション) を入力します。
既存の オブジェクト・ストレージ・サービス・インスタンス を選択するか、または新規作成します。
「作成」 をクリックします。
プロジェクトが開始したら、 管理 タブをクリックし、 サービスと統合 ページを選択してください。
IBM サービス」 タブで、 「サービスの関連付け」をクリックします。
Watson Machine Learning インスタンスを選択します。 Watson Machine Learning サービス・インスタンスがまだプロビジョンされていない場合は、以下の手順を実行します。
「新規サービス」をクリックします。
Watson Machine Learningを選択します。
「作成」 をクリックします。
リストから新規サービス・インスタンスを選択します。
「サービスの関連付け」をクリックします。
必要に応じて、 「キャンセル」 をクリックして 「サービス」&「統合」 ページに戻ります。
詳しくは、またはビデオを視聴するには、 プロジェクトの作成を参照してください。
進行状況を確認してください
以下の画像は、新規プロジェクトを示しています。
タスク 2: モデルの作成とトレーニング
このタスクをプレビューするには、 00:08から始まるビデオをご覧ください。
プロジェクトが作成されたので、 AutoAIを使用してモデルを作成およびトレーニングする準備ができました。 以下のステップに従って、 AutoAI エクスペリメントを作成し、モデル・パイプラインを確認し、モデルとして保存するパイプラインを選択します。
プロジェクトの 「資産」 タブをクリックしてから、 「新規資産」>「機械学習モデルの自動作成」をクリックします。
「機械学習モデルを自動的に作成」 ページで、以下の基本フィールドに入力します。
「リソース・ハブのサンプル」 パネルをクリックします。
「Bank marketing sample data」を選択し、 「次へ」をクリックします。 プロジェクト名と説明が自動的に入力されます。
プロジェクトに関連付けた Machine Learning サービス・インスタンスが Watson Machine Learning Service 「インスタンス」 フィールドで選択されていることを確認します。
「作成」 をクリックします。
このサンプルの AutoAI エクスペリメントでは、 「Bank marketing sample data」 が既にテスト用に選択されていることが分かります。
事前設定されたエクスペリメント設定を確認します。 AutoAI は、データ・セットと、予測対象として選択された列に基づいて、データのサブセットを分析し、最適化する予測タイプとメトリックを選択します。 この場合、予測タイプは 「二項分類」、正のクラスは 「はい」、最適化されたメトリックは ROC AUC & ランタイムです。
「エクスペリメントの実行 (Run experiment)」をクリックします。 モデルのトレーニング中に、パイプラインの作成プロセスを示すインフォグラフィックが表示されます。
AutoAI の各機械学習手法で使用可能なアルゴリズム または推定法のリストについては、 AutoAI 実装の詳細を参照してください。
エクスペリメントの実行が完了したら、ランク付けされたパイプラインをリーダーシップ・ボードで表示して比較することができます。
「パイプラインの比較」 をクリックすると、それらの違いを確認できます。
ランクが最も高いパイプラインをクリックして、パイプラインの詳細を表示します。
「名前を付けて保存」をクリックし、 「モデル」を選択して、 「作成」をクリックします。 これにより、パイプラインがモデルとしてプロジェクトに保存されます。
モデルが保存されたら、通知内の プロジェクトで表示 リンクをクリックして、プロジェクト内のモデルを表示します。 あるいは、プロジェクトの 「資産」 タブにナビゲートし、 「モデル」 セクションでモデル名をクリックすることもできます。
進行状況を確認してください
次の図は、モデルを示しています。
タスク 3: モデルをデプロイメント・スペースにプロモートし、トレーニング済みモデルをデプロイする
このタスクをプレビューするには、 04:57から始まるビデオをご覧ください。
モデルをデプロイする前に、モデルをデプロイメント・スペースにプロモートする必要があります。 モデルをデプロイメント・スペースにプロモートしてモデルをデプロイするには、以下の手順を実行します。
「デプロイメント・スペースにプロモート」 アイコン をクリックします。
既存のデプロイメント・スペースを選択してください。 デプロイメント・スペースがない場合は、以下のようにします。
「新規デプロイメント・スペースの作成」をクリックします。
スペース名とオプションの説明を提供します。
ストレージ・サービスを選択してください。
機械学習サービスを選択してください。
「作成」 をクリックします。
「閉じる」をクリックします。
リストから新規デプロイメント・スペースを選択します。
「プロモート後にスペース内のモデルに移動」 オプションを選択します。
プロモートをクリックします。
注: プロモート後にスペース内のモデルに移動するオプションを選択しなかった場合は、ナビゲーション・メニューを使用して 「デプロイメント」 にナビゲートし、デプロイメント・スペースとモデルを選択できます。モデルを開いた状態で、 「新規デプロイメント」をクリックします。
デプロイメント・タイプとして オンライン を選択してください。
デプロイメントの名前を指定します。
「作成」 をクリックします。
デプロイメントが完了したら、デプロイメント名をクリックして、デプロイメントの詳細ページを表示します。
進行状況を確認してください
以下のイメージは、新規デプロイメントを示しています。
タスク 4: デプロイされたモデルのテスト
このタスクをプレビューするには、 06:22から始まるビデオをご覧ください。
モデルがデプロイされたので、ユーザー・インターフェースまたは Watson Machine Learning API を使用して、そのオンライン・デプロイメントをテストできます。 ユーザー・インターフェースを使用して新規データでモデルをテストするには、以下の手順を実行します。
「テスト」 タブをクリックします。 デプロイされたモデルは、デプロイメントの詳細ページから 2 つの方法でテストできます:1 つはフォームを使用してテストし、もう 1 つは JSON コードを使用してテストします。
「JSON 入力」 タブをクリックし、以下のテスト・データをコピーして貼り付け、既存の JSON テキストを置き換えます。
{ "input_data": [ { "fields": [ "age", "job", "marital", "education", "default", "balance", "housing", "loan", "contact", "day", "month", "duration", "campaign", "pdays", "previous", "poutcome" ], "values": [ [ 27, "unemployed", "married", "primary", "no", 1787, "no", "no", "cellular", 19, "oct", 79, 1, -1, 0, "unknown" ] ] } ] }
指定した属性を持つ顧客が特定の種類のアカウントに登録する可能性が高いかどうかを予測するには、 予測 をクリックしてください。 結果の予測は、この顧客がマーケティング・プロモーションに登録しない可能性が高いことを示しています。
「X」 をクリックして、 「予測結果」 ウィンドウを閉じます。
進行状況を確認してください
以下のイメージは、デプロイメントのテスト結果を示しています。 予測の値は、以下の画像の値とは異なる場合があります。
タスク 5: モデルをスコアリングするバッチ・ジョブの作成
これで、デプロイされたモデルを単一の予測でテストしたので、バッチ・デプロイメントを作成して、複数のレコードを同時にスコアリングすることができます。
タスク 5a: バッチ・デプロイメントのセットアップ
このタスクをプレビューするには、 07:00から始まるビデオをご覧ください。
バッチ・デプロイメントの場合は、モデル・ペイロードとも呼ばれる入力データを CSV ファイルで提供します。 データは、同じ列ヘッダーを持つトレーニング・データと同様に構造化されている必要があります。 バッチ・ジョブは、データの各行を処理し、対応する予測を作成します。 ペイロード・データをデプロイメント・スペースにアップロードするには、以下の手順を実行します。
以下のテキストをコピーしてテキスト・エディターに貼り付け、ファイルを
bank-payload.csv
として保存します。age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome 30,unemployed,married,primary,no,1787,no,no,cellular,19,oct,79,1,-1,0,unknown 33,services,married,secondary,no,4789,yes,yes,cellular,11,may,220,1,339,4,failure 35,management,single,tertiary,no,1350,yes,no,cellular,16,apr,185,1,330,1,failure 30,management,married,tertiary,no,1476,yes,yes,unknown,3,jun,199,4,-1,0,unknown 59,blue-collar,married,secondary,no,0,yes,no,unknown,5,may,226,1,-1,0,unknown 35,management,single,tertiary,no,747,no,no,cellular,23,feb,141,2,176,3,failure 36,self-employed,married,tertiary,no,307,yes,no,cellular,14,may,341,1,330,2,other 39,technician,married,secondary,no,147,yes,no,cellular,6,may,151,2,-1,0,unknown 41,entrepreneur,married,tertiary,no,221,yes,no,unknown,14,may,57,2,-1,0,unknown 43,services,married,primary,no,-88,yes,yes,cellular,17,apr,313,1,147,2,failure 39,services,married,secondary,no,9374,yes,no,unknown,20,may,273,1,-1,0,unknown 43,admin.,married,secondary,no,264,yes,no,cellular,17,apr,113,2,-1,0,unknown 36,technician,married,tertiary,no,1109,no,no,cellular,13,aug,328,2,-1,0,unknown 20,student,single,secondary,no,502,no,no,cellular,30,apr,261,1,-1,0,unknown 31,blue-collar,married,secondary,no,360,yes,yes,cellular,29,jan,89,1,241,1,failure 40,management,married,tertiary,no,194,no,yes,cellular,29,aug,189,2,-1,0,unknown 56,technician,married,secondary,no,4073,no,no,cellular,27,aug,239,5,-1,0,unknown 37,admin.,single,tertiary,no,2317,yes,no,cellular,20,apr,114,1,152,2,failure 25,blue-collar,single,primary,no,-221,yes,no,unknown,23,may,250,1,-1,0,unknown 31,services,married,secondary,no,132,no,no,cellular,7,jul,148,1,152,1,other
ナビゲーション・トレールでデプロイメント・スペースをクリックします。
「資産」タブをクリックします。
bank-payload.csv ファイルをサイド・パネルにドラッグし、ファイルがアップロードされるのを待ちます。
進行状況を確認してください
以下のイメージは、デプロイメント・スペースの 「資産」 タブを示しています。
タスク 5b: バッチ・デプロイメントの作成
このタスクをプレビューするには、 07:30から始まるビデオをご覧ください。
入力バッチを処理し、出力をリアルタイムで表示する代わりにファイルに書き込むには、バッチ・デプロイメント・ジョブを作成します。
デプロイメント・スペースの 「資産」 タブに移動します。
モデルの 「オーバーフロー」 メニュー をクリックし、 「デプロイ」を選択します。
「デプロイメント・タイプ」で、 「バッチ」を選択します。
デプロイメントの名前を入力します。
最小のハードウェア仕様を選択します。
「作成」 をクリックします。
進行状況を確認してください
以下の画像は、バッチ・デプロイメントを示しています。
タスク 5c: バッチ・ジョブの作成
このタスクをプレビューするには、 07:44から始まるビデオをご覧ください。
バッチ・ジョブがデプロイメントを実行します。 ジョブを作成するには、入力データと出力ファイルの名前を指定します。 ジョブをスケジュールに従って実行するか、または即時に実行するように設定できます。 バッチ・ジョブを作成するには、以下の手順を実行します。
デプロイメント・ページで、 「新規ジョブ」をクリックします。
ジョブの名前を指定して、 「次へ」をクリックします。
最小のハードウェア仕様を選択し、 「次へ」をクリックします。
オプション: スケジュールを設定し、 「次へ」をクリックします。
オプション: 通知を受け取ることを選択し、 「次へ」をクリックします。
「データの選択」 画面で、 「入力」 データを選択します。
「データ・ソースの選択」をクリックします。
「データ資産」> bank-payload.csvを選択します。
「確認 (Confirm)」をクリックします。
「データの選択」 画面に戻り、 「出力」 ファイルを指定します。
追加 をクリックします。
「データ・ソースの選択」をクリックします。
「新規作成」 タブが選択されていることを確認します。
名前の場合は、
bank-output.csv
と入力します。「確認 (Confirm)」をクリックします。
最後のステップの 「次へ」 をクリックします。
設定を確認し、 「作成して実行」 をクリックしてジョブを即時に実行します。
進行状況を確認してください
以下のイメージは、バッチ・デプロイメントのジョブの詳細を示しています。
タスク 5d: 出力の表示
このタスクをプレビューするには、 08:42から始まるビデオをご覧ください。
バッチ・ジョブからの出力ファイルを確認するには、以下のステップを実行します。
状況を確認するには、ジョブ名をクリックします。
状況が 「完了」に変わったら、ナビゲーション・トレールでデプロイメント・スペース名をクリックします。
「資産」タブをクリックします。
bank-output.csv ファイルをクリックして、バッチ処理のために送信された顧客情報の予測結果を確認します。 いずれの場合も、これらの顧客が銀行のプロモーションをサブスクライブする可能性は低いと予測されます。
進行状況を確認してください
次の図は、バッチ・デプロイメント・ジョブの結果を示しています。
次のステップ
これで、このデータ・セットをさらに分析するために使用できます。 例えば、ユーザーまたは他のユーザーは、以下のいずれかのタスクを実行できます:
その他のリソース
AutoAIを使用したモデルの作成についてより実践的な経験を得るには、以下の追加チュートリアルをお試しください。
モデルを作成するには、以下の他の方法を試してください。
詳しくは、 ビデオを参照してください。
リソース・ハブでサンプル・データ・セット、プロジェクト、モデル、プロンプト、およびノートブックを検索して、実地体験を得ることができます。
データの分析およびモデルの作成を開始するためにプロジェクトに追加できる ノートブック 。
プロジェクト ノートブック、データ・セット、プロンプト、およびその他の資産を含むものをインポートできます。
データ・セット 。これをプロジェクトに追加して、モデルの精製、分析、およびビルドを行うことができます。
プロンプト 。プロンプト・ラボで基盤モデルのプロンプトを出すために使用できます。
プロンプト・ラボで使用できる 基盤モデル 。
親トピック: クイック・スタート・チュートリアル