クイック・スタート: AutoAI を使用して機械学習モデルを作成とデプロイする
AutoAI ツールを使用して、機械学習モデルの作成プロセスを自動化できます。 AutoAI ツールについて読み、ビデオを見て初心者向けのチュートリアルを受けます。コーディングは必要ありません。
基本的なワークフローには、以下のタスクが含まれます:
- サンドボックス・プロジェクトを開きます。 プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
- データをプロジェクトに追加します。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
- プロジェクトで AutoAI エクスペリメントを作成します。
- モデル・パイプラインを確認し、デプロイするモデルとして、またはカスタマイズするノートブックとして、目的のパイプラインを保存します。
- モデルをデプロイしてテストします。
AutoAI について読む
AutoAI グラフィック・ツールは、データを自動的に分析し、予測モデリングの問題に合わせてカスタマイズされた候補モデル・パイプラインを生成します。 これらのモデル・パイプラインは、AutoAI がデータ・セットを分析し、問題設定に最適なデータ変換、アルゴリズム、およびパラメーター設定を検出するときに、繰り返し作成されます。 結果はリーダーボードに表示され、自動的に生成されたモデル・パイプラインが、ユーザーの問題最適化目標に従ってランク付けされた順序で示されます。
AutoAI を使用してモデルの作成に関するビデオを見る
このビデオを見て、銀行マーケティング・サンプルに基づいて AutoAI エクスペリメントを作成して実行する方法を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
AutoAI を使用してチュートリアルを受けてモデルを作成する
このチュートリアルでは、マーケティング・キャンペーンに基づいて顧客が定期預金をサブスクライブする可能性があるかどうかを予測するためのモデルのトレーニングについて説明します。
このチュートリアルでは、以下のタスクを実行します:
- タスク 1: プロジェクトを開きます。
- タスク 2: モデルの作成とトレーニング。
- タスク 3: モデルをデプロイメント・スペースにプロモートし、トレーニング済みモデルをデプロイする
- タスク 4: デプロイされたモデルをテストします。
- タスク 5: モデルをスコアリングするためのバッチ・ジョブを作成します。
このチュートリアルを完了するための所要時間は約 30 分です。
サンプル・データ
ガイド付きエクスペリエンスで使用されるサンプル・データは、UCI: 顧客がマーケティング・プロモーションに登録するかどうかを予測するために使用される銀行マーケティング・データです。
- このチュートリアルを完了するためのヒント
ピクチャー・イン・ピクチャーの使用
ヒント: ビデオを開始してから、チュートリアルをスクロールすると、ビデオはピクチャー・イン・ピクチャー・モードに移行します。 ピクチャー・イン・ピクチャーを最大限に活用するには、ビデオの目次を閉じます。 ピクチャー・イン・ピクチャー・モードを使用して、このチュートリアルのタスクを完了する際にビデオをフォローすることができます。 後続の各タスクのタイム・スタンプをクリックします。以下のアニメーション・イメージは、ビデオ・ピクト・イン・ピクチャーおよび目次フィーチャーの使用方法を示しています。
コミュニティーのヘルプを表示する
このチュートリアルでヘルプが必要な場合は、 Cloud Pak for Data コミュニティー・ディスカッション・フォーラムで質問したり、回答を見つけたりすることができます。
ブラウザー・ウィンドウのセットアップ
このチュートリアルを完了する最適な方法として、1 つのブラウザー・ウィンドウで Cloud Pak for Data を開き、このチュートリアル・ページを別のブラウザー・ウィンドウで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。 2 つのブラウザー・ウィンドウを横並びに配置して、追跡しやすくすることを検討してください。
ヒント: ユーザー・インターフェースでこのチュートリアルを実行しているときにガイド・ツアーが表示された場合は、 「後で行うこともあります」をクリックします。
上に戻る
- タスク 1: プロジェクトを開く
データと AutoAI エクスペリメントを保管するためのプロジェクトが必要です。 サンドボックス・プロジェクトを使用することも、プロジェクトを作成することもできます。
ナビゲーション・メニュー
から、 「プロジェクト」>「すべてのプロジェクトを表示」 を選択します。
サンドボックス・プロジェクトを開きます。 新規プロジェクトを使用する場合は、以下のようにします。
新規プロジェクトをクリックしてください。
「空のプロジェクトの作成」を選択します。
プロジェクトの名前と説明 (オプション) を入力します。
既存の オブジェクト・ストレージ・サービス・インスタンス を選択するか、または新規作成します。
「作成」 をクリックします。
プロジェクトが開始したら、 管理 タブをクリックし、 サービスと統合 ページを選択してください。
「IBM サービス」 タブで、 「サービスの関連付け」をクリックします。
Watson Machine Learning インスタンスを選択します。 Watson Machine Learning サービス・インスタンスがまだプロビジョンされていない場合は、以下の手順を実行します。
「新規サービス」をクリックします。
Watson Machine Learningを選択します。
「作成」 をクリックします。
リストから新規サービス・インスタンスを選択します。
「サービスの関連付け」をクリックします。
必要に応じて、 「キャンセル」 をクリックして 「サービス」&「統合」 ページに戻ります。
詳細情報やビデオの視聴については、 プロジェクトの作成を参照してください。
進行状況の確認
以下の画像は、新規プロジェクトを示しています。
上に戻る
- タスク 2: モデルの作成とトレーニング
このタスクをプレビューするには、 00:08からビデオを視聴してください。
プロジェクトが作成されたので、 AutoAIを使用してモデルを作成およびトレーニングする準備ができました。 以下のステップに従って、 AutoAI エクスペリメントを作成し、モデル・パイプラインを確認し、モデルとして保存するパイプラインを選択します。
プロジェクトの 「資産」 タブをクリックし、 「新規資産」>「機械学習モデルの自動ビルド」をクリックします。
「機械学習モデルを自動的に作成 (Build machine learning models automatically)」 ページで、以下の基本フィールドに入力します。
「サンプル」 パネルをクリックします。
「銀行マーケティング・サンプル・データ」を選択し、 「次へ」をクリックします。 プロジェクト名と説明が自動的に入力されます。
プロジェクトに関連付けた Machine Learning サービス・インスタンスが Watson Machine Learning Service 「インスタンス」 フィールドで選択されていることを確認します。
「作成」 をクリックします。
このサンプル AutoAI エクスペリメントでは、 銀行マーケティング・サンプル・データ が既にエクスペリメント用に選択されていることが分かります。
事前設定されたエクスペリメント設定を確認します。 AutoAI は、データ・セットと、予測対象として選択された列に基づいて、データのサブセットを分析し、最適化する予測タイプとメトリックを選択します。 この場合、予測タイプは 「バイナリー分類」、正のクラスは 「はい」、最適化されたメトリックは ROC AUC & ランタイムです。
「エクスペリメントの実行 (Run experiment)」をクリックします。 モデルのトレーニング中に、パイプラインの作成プロセスを示すインフォグラフィックが表示されます。
AutoAI の各機械学習手法で使用可能なアルゴリズム または推定法のリストについては、 AutoAI 実装の詳細を参照してください。
エクスペリメントの実行が完了すると、ランク付けされたパイプラインをリーダーボードで表示して比較することができます。
「パイプラインの比較 (Pipeline comparison)」 をクリックして、それらの違いを確認できます。
ランクが最も高いパイプラインをクリックして、パイプラインの詳細を表示します。
「名前を付けて保存」をクリックし、 「モデル」を選択して、 「作成」をクリックします。 これにより、パイプラインがモデルとしてプロジェクトに保存されます。
モデルが保存されたら、通知内の プロジェクトで表示 リンクをクリックして、プロジェクト内のモデルを表示します。 あるいは、プロジェクトの 「資産」 タブにナビゲートし、 「モデル」 セクションでモデル名をクリックすることもできます。
進行状況の確認
次の画像は、モデルを示しています。
上に戻る
- タスク 3: モデルをデプロイメント・スペースにプロモートし、トレーニング済みモデルをデプロイする
このタスクをプレビューするには、 04:57から始まるビデオをご覧ください。
モデルをデプロイする前に、モデルをデプロイメント・スペースにプロモートする必要があります。 モデルをデプロイするデプロイメント・スペースにモデルをプロモートするには、以下の手順を実行します。
デプロイメント・スペースにプロモートをクリックしてください。
既存のデプロイメント・スペースを選択してください。 デプロイメント・スペースがない場合は、以下のようにします。
「新規デプロイメント・スペースの作成」をクリックします。
スペース名とオプションの説明を提供します。
ストレージ・サービスを選択してください。
機械学習サービスを選択してください。
「作成」 をクリックします。
「閉じる」をクリックします。
リストから新規デプロイメント・スペースを選択します。
「プロモート後にスペース内のモデルに移動」 オプションを選択します。
プロモートをクリックします。
注: プロモート後にスペース内のモデルに移動するオプションを選択しなかった場合は、ナビゲーション・メニューを使用して 「デプロイメント」 にナビゲートし、デプロイメント・スペースとモデルを選択できます。モデルを開いた状態で、 「新規デプロイメント」をクリックします。
デプロイメント・タイプとして オンライン を選択してください。
デプロイメントの名前を指定します。
「作成」 をクリックします。
デプロイメントが完了したら、デプロイメント名をクリックして、デプロイメントの詳細ページを表示します。
進行状況の確認
以下のイメージは、新規デプロイメントを示しています。
上に戻る
- タスク 4: デプロイされたモデルのテスト
このタスクをプレビューするには、 06:22から始まるビデオをご覧ください。
モデルがデプロイされたので、ユーザー・インターフェースまたは Watson Machine Learning API を使用して、そのオンライン・デプロイメントをテストできます。 ユーザー・インターフェースを使用して新しいデータでモデルをテストするには、以下の手順を実行します。
「テスト」 タブをクリックします。 デプロイされたモデルは、デプロイメントの詳細ページから 2 つの方法でテストできます:1 つはフォームを使用してテストし、もう 1 つは JSON コードを使用してテストします。
「JSON 入力」 タブをクリックし、以下のテスト・データをコピーして貼り付け、既存の JSON テキストを置き換えます。
{ "input_data": [ { "fields": [ "age", "job", "marital", "education", "default", "balance", "housing", "loan", "contact", "day", "month", "duration", "campaign", "pdays", "previous", "poutcome" ], "values": [ [ 27, "unemployed", "married", "primary", "no", 1787, "no", "no", "cellular", 19, "oct", 79, 1, -1, 0, "unknown" ] ] } ] }
指定した属性を持つ顧客が特定の種類のアカウントに登録する可能性が高いかどうかを予測するには、 予測 をクリックしてください。 結果の予測は、この顧客がマーケティング・プロモーションに登録しない可能性が高いことを示しています。
「X」 をクリックして、 「予測結果」 ウィンドウを閉じます。
進行状況の確認
以下のイメージは、デプロイメントのテスト結果を示しています。 予測の値は、以下の画像の値と異なる場合があります。
上に戻る
- タスク 5: モデルをスコアリングするバッチ・ジョブの作成
デプロイされたモデルを単一の予測でテストしたので、複数のレコードを同時にスコアリングするバッチ・デプロイメントを作成できます。
タスク 5a: バッチ・デプロイメントのセットアップ
このタスクをプレビューするには、 07:00から始まるビデオをご覧ください。
バッチ・デプロイメントの場合は、モデル・ペイロードとも呼ばれる入力データを CSV ファイルで提供します。 データは、同じ列ヘッダーを持つトレーニング・データと同様に構造化されている必要があります。 バッチ・ジョブは、データの各行を処理し、対応する予測を作成します。 ペイロード・データをデプロイメント・スペースにアップロードするには、以下の手順を実行します。
以下のテキストをコピーしてテキスト・エディターに貼り付け、ファイルを
bank-payload.csv
として保存します。age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome 30,unemployed,married,primary,no,1787,no,no,cellular,19,oct,79,1,-1,0,unknown 33,services,married,secondary,no,4789,yes,yes,cellular,11,may,220,1,339,4,failure 35,management,single,tertiary,no,1350,yes,no,cellular,16,apr,185,1,330,1,failure 30,management,married,tertiary,no,1476,yes,yes,unknown,3,jun,199,4,-1,0,unknown 59,blue-collar,married,secondary,no,0,yes,no,unknown,5,may,226,1,-1,0,unknown 35,management,single,tertiary,no,747,no,no,cellular,23,feb,141,2,176,3,failure 36,self-employed,married,tertiary,no,307,yes,no,cellular,14,may,341,1,330,2,other 39,technician,married,secondary,no,147,yes,no,cellular,6,may,151,2,-1,0,unknown 41,entrepreneur,married,tertiary,no,221,yes,no,unknown,14,may,57,2,-1,0,unknown 43,services,married,primary,no,-88,yes,yes,cellular,17,apr,313,1,147,2,failure 39,services,married,secondary,no,9374,yes,no,unknown,20,may,273,1,-1,0,unknown 43,admin.,married,secondary,no,264,yes,no,cellular,17,apr,113,2,-1,0,unknown 36,technician,married,tertiary,no,1109,no,no,cellular,13,aug,328,2,-1,0,unknown 20,student,single,secondary,no,502,no,no,cellular,30,apr,261,1,-1,0,unknown 31,blue-collar,married,secondary,no,360,yes,yes,cellular,29,jan,89,1,241,1,failure 40,management,married,tertiary,no,194,no,yes,cellular,29,aug,189,2,-1,0,unknown 56,technician,married,secondary,no,4073,no,no,cellular,27,aug,239,5,-1,0,unknown 37,admin.,single,tertiary,no,2317,yes,no,cellular,20,apr,114,1,152,2,failure 25,blue-collar,single,primary,no,-221,yes,no,unknown,23,may,250,1,-1,0,unknown 31,services,married,secondary,no,132,no,no,cellular,7,jul,148,1,152,1,other
ナビゲーション・トレールでデプロイメント・スペースをクリックします。
「資産」タブをクリックします。
bank-payload.csv ファイルをサイド・パネルにドラッグし、ファイルがアップロードされるのを待ちます。
進行状況の確認
以下のイメージは、デプロイメント・スペースの 「アセット」 タブを示しています。
タスク 5b: バッチ・デプロイメントの作成
このタスクをプレビューするには、 07:30から始まるビデオをご覧ください。
入力バッチを処理し、出力をリアルタイムで表示する代わりにファイルに書き込むには、バッチ・デプロイメント・ジョブを作成します。
デプロイメント・スペースの 「資産」 タブに移動します。
モデルの
「オーバーフロー」 メニューをクリックし、 「デプロイ」を選択します。
「デプロイメント・タイプ」には、 「バッチ」を選択します。
デプロイメントの名前を入力します。
最小のハードウェア仕様を選択します。
「作成」 をクリックします。
進行状況の確認
以下のイメージは、バッチ・デプロイメントを示しています。
タスク 5c: バッチ・ジョブの作成
このタスクをプレビューするには、 07:44からビデオをご覧ください。
バッチ・ジョブがデプロイメントを実行します。 ジョブを作成するには、入力データと出力ファイルの名前を指定します。 ジョブをスケジュールに従って実行するか、または即時に実行するように設定できます。 バッチ・ジョブを作成するには、以下のステップを実行します。
デプロイメント・ページで、 「新規ジョブ」をクリックします。
ジョブの名前を指定し、 「次へ」をクリックします。
最小ハードウェア仕様を選択し、 「次へ」をクリックします。
オプション: スケジュールを設定し、 「次へ」をクリックします。
オプション: 通知の受信を選択して、 「次へ」をクリックします。
「データの選択」 画面で、 「入力」 データを選択します。
「データ・ソースの選択」をクリックします。
「データ資産」>「 bank-payload.csv」を選択します。
「確認 (Confirm)」をクリックします。
「データの選択」 画面に戻り、 出力 ファイルを指定します。
追加 をクリックします。
「データ・ソースの選択」をクリックします。
「新規作成」 タブが選択されていることを確認します。
名前の場合は、
bank-output.csv
と入力します。「確認 (Confirm)」をクリックします。
「次へ」 をクリックして最終ステップに進みます。
設定を確認し、 「作成して実行」 をクリックして、ジョブを即時に実行します。
進行状況の確認
以下のイメージは、バッチ・デプロイメントのジョブの詳細を示しています。
タスク 5d: 出力の表示
このタスクをプレビューするには、 08:42以降のビデオをご覧ください。
バッチ・ジョブからの出力ファイルを確認するには、以下のステップを実行します。
状況を確認するには、ジョブ名をクリックします。
状況が 「完了」に変わったら、ナビゲーション・トレールでデプロイメント・スペース名をクリックします。
「資産」タブをクリックします。
bank-output.csv ファイルをクリックして、バッチ処理のために送信された顧客情報の予測結果を確認します。 いずれの場合も、これらの顧客が銀行のプロモーションをサブスクライブする可能性は低いと予測されます。
進行状況の確認
以下のイメージは、バッチ・デプロイメント・ジョブの結果を示しています。
上に戻る
次のステップ
これで、このデータ・セットをさらに分析するために使用できます。 例えば、ユーザーまたは他のユーザーは、以下のいずれかのタスクを実行できます:
その他のリソース
AutoAIを使用したモデルの作成についてより実践的な経験を得るには、以下の追加チュートリアルをお試しください。
モデルを作成するには、以下の他の方法を試してください。
詳しくは、 ビデオを参照してください。
サンプル内のサンプル・データ・セット、プロジェクト、モデル、プロンプト、およびノートブックを見つけて、ハンズオン・エクスペリエンスを実現します。
ノートブック 。データの分析とモデルの作成を開始するためにプロジェクトに追加できます。
プロジェクト 。ノートブック、データ・セット、プロンプト、およびその他の資産を含むインポートが可能です。
データ・セット 。モデルを詳細化、分析、および作成するためにプロジェクトに追加できます。
プロンプト 。プロンプト・ラボで基盤モデルのプロンプトを出すために使用できます。
プロンプト・ラボで使用できる
基盤モデル 。
親トピック: クイック・スタート・チュートリアル