AutoAI ツールを使用して、機械学習モデルの作成プロセスを自動化できます。 AutoAI ツールについて読み、ビデオを見て初心者向けのチュートリアルを受けます。コーディングは必要ありません。
- 必須のサービス
- watsonx.aiスタジオ
- watsonx.aiランタイム
基本的なワークフローには、以下のタスクが含まれます:
- プロジェクトを作成する プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
- データをプロジェクトに追加します。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
- プロジェクトで AutoAI エクスペリメントを作成します。
- モデル・パイプラインを確認し、デプロイするモデルとして、またはカスタマイズするノートブックとして、目的のパイプラインを保存します。
- モデルをデプロイしてテストします。
AutoAI について読む
AutoAI グラフィック・ツールは、データを自動的に分析し、予測モデリングの問題に合わせてカスタマイズされた候補モデル・パイプラインを生成します。 これらのモデル・パイプラインは、AutoAI がデータ・セットを分析し、問題設定に最適なデータ変換、アルゴリズム、およびパラメーター設定を検出するときに、繰り返し作成されます。 結果はリーダーボードに表示され、自動的に生成されたモデル・パイプラインが、ユーザーの問題最適化目標に従ってランク付けされた順序で示されます。
AutoAI を使用してモデルの作成に関するビデオを見る
このビデオを見て、銀行マーケティング・サンプルに基づいて AutoAI エクスペリメントを作成して実行する方法を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
動画のトランスクリプト 時刻 トランスクリプト 00:00 このビデオでは、AutoAIのサンプル実験を実行してMachine Learningモデルを作成する方法を紹介します。 00:08 プロジェクトを開始し、そのプロジェクトに新しいAutoAI実験を追加する。 00:16 AutoAIの実験を実行するには、Machine Learningサービスが必要です。 00:22 ここでは、Machine Learningサービスをこのプロジェクトに関連付けるオプションがある。 00:29 新規サービス・インスタンスを作成することも、既存のサービス・インスタンスを選択することもできます。 00:39 エクスペリメントを作成しているページに戻ると、ページを再ロードするだけで、新しいサービス・インスタンスがリストされます。 00:48 この最初のエクスペリメントでは、サンプルを選択します。 00:52 「銀行マーケティング」サンプルには、マーケティング・キャンペーンに対応して銀行への電話から収集されたテキスト・データが含まれています。 01:01 サンプルを選択すると、エクスペリメントの名前と説明が自動的に入力されるため、エクスペリメントを作成する準備が整います。 01:11 次に、AutoAI エクスペリメント・ビルダーが表示されます。 01:15 このエクスペリメントはサンプルからのものであるため、銀行のマーケティング・ソース・ファイルは既に選択されています。 01:22 また、予測する列も既に選択されています。 01:26 この場合、「y」列は、ユーザーがマーケティング・キャンペーンの一環として定期預金を申し込むかどうかを表します。 01:35 AutoAI は、データ・セットと、予測対象として選択された列に基づいて、データのサブセットを分析し、最適化する予測タイプとメトリックを選択します。 01:47 この場合、予測する列に「Y」または「N」(「はい」または「いいえ」) の値が含まれているため、二項分類が選択されました。 01:57 正のクラスは「Yes」で、最適化されたメトリックは ROC AUC です。 02:03 ROC AUC メトリックは、精度、確度、および再現率のバランスを取ります。 02:10 では、エクスペリメントを実行し、「パイプライン・リーダーボード」が埋まるのを待ちます。 02:17 AutoAI トレーニング中に、データ・セットはトレーニング・データとホールドアウト・データの 2 つの部分に分割されます。 02:24 トレーニング・データは、 AutoAI トレーニング・ステージでモデル・パイプラインを生成するために使用され、クロス検証スコアを使用してそれらのモデル・パイプラインをランク付けします。 02:34 トレーニング後、ホールドアウト・データは、結果のパイプライン・モデルの評価およびパフォーマンス情報 (例:ROC 曲線やコンフュージョン・マトリックスなど) の計算に使用されます。 02:48 次に、AutoAI は、XGBoost 分類器などの様々な推定器や、ハイパーパラメータ最適化や特徴工学などの機能拡張を用いたパイプラインを生成し、そのパイプラインを確度指標に基づいてランク付けします。 03:06 ハイパーパラメーターの最適化は、潜在的なハイパーパラメーターの探索スペースを自動的に探索し、一連のモデルを作成し、関心のあるメトリックを使用してモデルを比較するためのメカニズムです。 03:20 特徴量エンジニアリングは、問題を最も適切に表す特徴量の組み合わせに生データを変換することで、最も正確な予測を実現することを試みます。 03:31 さて、実行が完了しました。 03:34 凡例では、関係マップ上のデータ、上位アルゴリズム、パイプライン、およびフィーチャー・トランスフォーマーの場所を説明します。 03:44 完全なログを表示して、完全な詳細を確認できます。 03:48 デフォルトでは「関係マップ」を閲覧できますが、ビューをスワップして「進行状況マップ」を見ることができます。 03:57 スクロールダウンして、リーダーボードを確認します。 04:01 パイプラインの比較から開始することをお勧めします。 04:05 このグラフは、8つのパイプラインの指標を提供し、クロス検証スコアまたはホールドアウト・スコアで表示されました。 04:13 平均精度など、他のメトリックに基づいてランク付けされたパイプラインを確認できます。 04:21 「実験の要約」タブに戻り、パイプラインを展開して、モデル評価指標と ROC 曲線を表示します。 04:30 個々のパイプラインを閲覧して、混同行列、精度再現曲線、モデル情報、特徴量変換、および特徴量重要度に加えて、より詳細な情報を確認することができます。 04:49 このパイプラインのランキングが最も高かったため、これを機械学習モデルとして保存できます。 04:55 デフォルトを受け入れて、モデルを保存するだけです。 05:01 モデルのトレーニングが完了したので、モデルを閲覧してデプロイする準備ができました。 05:06 「概要」タブには、モデルの要約と入力スキーマが表示されます。 05:12 モデルをデプロイするには、これをデプロイメント・スペースにプロモートする必要があります。 05:17 このプロジェクトにはまだデプロイメント・スペースが関連付けられていないため、まず関連付けをセットアップする必要があります。 05:25 既存のデプロイメント・スペースを選択することも、新規デプロイメント・スペースを作成することもできます。 05:31 新しいスペースを作成するときは、名前と説明を入力し、Cloud Object StorageandMachine Learningサービスを選択するだけです。 05:41 次に、スペースを作成します。 05:45 この新しいスペースを選択し、モデルの説明を追加して、「プロモート」をクリックしてください。 05:53 リンクを使用してデプロイメント・スペースに移動します。 06:00 これが先ほど作成したモデルです、これをデプロイすることができます。 06:04 この場合、オンライン・デプロイメントになります。 06:08 デプロイメントの名前を提供し、「作成」をクリックしてください。 06:12 その後、モデルがデプロイされるまで待ちます。 06:16 モデルのデプロイメントが完了したら、デプロイメントを表示します。 06:20 「API リファレンス」タブに、今後の参考のために、スコアリング・エンドポイントが記載されています。 06:26 また、アプリケーションからこのデプロイメントを使用するために、さまざまなプログラミング言語のコード・スニペットも記載しています。 06:35 「テスト」タブで、モデル予測をテストできます。 06:40 テスト入力データを入力するか、または JSON 入力データを貼り付けて、「予測」をクリックすることができます。 06:52 これは、最初の人が定期預金に加入しない可能性が非常に高く、2 番目の人が定期預金に加入する可能性が高いことを示しています。 07:06 プロジェクトに戻ると、「資産」タブに AutoAI エクスペリメントとモデルが表示されます。 07:17 Cloud Pak for Data as a Service の資料には他にもビデオがあります。
AutoAI を使用してチュートリアルを受けてモデルを作成する
このチュートリアルでは、マーケティング・キャンペーンに基づいて顧客が定期預金をサブスクライブする可能性があるかどうかを予測するためのモデルのトレーニングについて説明します。
このチュートリアルでは、以下のタスクを実行します:
- タスク 1: プロジェクトを開きます。
- タスク 2: モデルの作成とトレーニング。
- タスク 3: モデルをデプロイメント・スペースにプロモートし、トレーニング済みモデルをデプロイする
- タスク 4: デプロイされたモデルをテストします。
- タスク 5: モデルをスコアリングするためのバッチ・ジョブを作成します。
このチュートリアルを完了するための所要時間は約 30 分です。
サンプル・データ
ガイド付きエクスペリエンスで使用されるサンプル・データは、UCI です。顧客がマーケティング promotion.The データは、テストの基礎として 「リソース・ハブ・サンプル」 を選択すると、自動的にアップロードされ、使用可能になります。
このチュートリアルを完了するためのヒント
このチュートリアルを正常に完了するためのヒントを以下に示します。
ビデオ・ピクチャー・イン・ピクチャーの使用
以下のアニメーション・イメージは、ビデオ・ピクチャー・イン・ピクチャーおよび目次機能の使用方法を示しています。
コミュニティーでのヘルプの利用
このチュートリアルでヘルプが必要な場合は、Cloud Pak for DataCommunityディスカッションフォーラムで質問したり、回答を見つけることができます。
ブラウザー・ウィンドウのセットアップ
このチュートリアルを最適に実行するには、1 つのブラウザー・ウィンドウで Cloud Pak for Data を開き、このチュートリアル・ページを別のブラウザー・ウィンドウで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。 2 つのブラウザー・ウィンドウを横並びに配置して、見やすくすることを検討してください。
タスク 1: プロジェクトを開く
データおよび AutoAI エクスペリメントを保管するためのプロジェクトが必要です。 既存のプロジェクトを使用することも、プロジェクトを作成することもできます。
ナビゲーションメニュー「」から、「プロジェクト」 > 「すべてのプロジェクトを表示」を選択する
既存のプロジェクトを開きます。 新規プロジェクトを使用する場合は、以下のようにします。
新規プロジェクトをクリックしてください。
「空のプロジェクトの作成」を選択します。
プロジェクトの名前と説明 (オプション) を入力します。
既存の オブジェクト・ストレージ・サービス・インスタンス を選択するか、または新規作成します。
「作成」 をクリックします。
プロジェクトが開始したら、 管理 タブをクリックし、 サービスと統合 ページを選択してください。
IBM サービス」 タブで、 「サービスの関連付け」をクリックします。
watsonx.aiランタイムインスタンスを選択します。 watsonx.aiRuntime サービスインスタンスがまだプロビジョニングされていない場合は、以下の手順に従ってください:
「新規サービス」をクリックします。
watsonx.aiランタイムを選択します。
「作成」 をクリックします。
リストから新規サービス・インスタンスを選択します。
「サービスの関連付け」をクリックします。
必要に応じて、 「キャンセル」 をクリックして 「サービス」&「統合」 ページに戻ります。
関連サービスの詳細については、「プロジェクトの作成 関連サービスの追加参照してください。
進捗状況を確認する
以下の画像は、新規プロジェクトを示しています。
タスク 2: モデルの作成とトレーニング
このタスクをプレビューするには、00:08から始まるビデオをご覧ください。
プロジェクトが作成されたので、 AutoAIを使用してモデルを作成およびトレーニングする準備ができました。 以下のステップに従って、 AutoAI エクスペリメントを作成し、モデル・パイプラインを確認し、モデルとして保存するパイプラインを選択します。
クリック資産タブをクリックして、新しいアセット > 機械学習モデルを自動的に構築。
「 AutoAI エクスペリメントの作成」 ページで、以下の基本フィールドに入力します。
「リソース・ハブのサンプル」 パネルをクリックします。
「Bank marketing sample data」を選択し、 「次へ」をクリックします。 プロジェクト名と説明が自動的に入力されます。
プロジェクトに関連付けた「watsonx.aiランタイムサービスインスタンスが「watsonx.aiランタイム・サービス・インスタンスフィールドで選択されていることを確認します。
「作成」 をクリックします。
このサンプルの AutoAI エクスペリメントでは、 「Bank marketing sample data」 が既にテスト用に選択されていることが分かります。
事前設定されたエクスペリメント設定を確認します。 AutoAI は、データ・セットと、予測対象として選択された列に基づいて、データのサブセットを分析し、最適化する予測タイプとメトリックを選択します。 この場合、予測タイプは 「二項分類」、正のクラスは 「はい」、最適化されたメトリックは ROC AUC & ランタイムです。
「実験の実行 (Run experiment)」をクリックします。 モデルがトレーニングすると、パイプラインの構築過程を示すインフォグラフィックが表示される。
'AutoAI の各機械学習手法で使用可能なアルゴリズム または推定法のリストについては、 AutoAI 実装の詳細を参照してください。
エクスペリメントの実行が完了したら、ランク付けされたパイプラインをリーダーシップ・ボードで表示して比較することができます。
「パイプラインの比較」 をクリックすると、それらの違いを確認できます。
ランクが最も高いパイプラインをクリックして、パイプラインの詳細を表示します。
「名前を付けて保存」をクリックし、 「モデル」を選択して、 「作成」をクリックします。 これにより、パイプラインがモデルとしてプロジェクトに保存されます。
モデルが保存されたら、通知内の プロジェクトで表示 リンクをクリックして、プロジェクト内のモデルを表示します。 あるいは、プロジェクトの 「資産」 タブにナビゲートし、 「モデル」 セクションでモデル名をクリックすることもできます。
進捗状況を確認する
次の図は、モデルを示しています。
タスク 3: モデルをデプロイメント・スペースにプロモートし、トレーニング済みモデルをデプロイする
このタスクをプレビューするには、 04:57から始まるビデオをご覧ください。
モデルをデプロイする前に、モデルをデプロイメント・スペースにプロモートする必要があります。 モデルをデプロイメント・スペースにプロモートしてモデルをデプロイするには、以下の手順を実行します。
配備促進スペースアイコン「」をクリックする。
既存のデプロイメント・スペースを選択してください。 デプロイメント・スペースがない場合は、以下のようにします。
「新規デプロイメント・スペースの作成」をクリックします。
スペース名とオプションの説明を提供します。
ストレージ・サービスを選択してください。
機械学習サービスを選択してください。
「作成」 をクリックします。
「閉じる」をクリックします。
リストから新規デプロイメント・スペースを選択します。
「プロモート後にスペース内のモデルに移動」 オプションを選択します。
プロモートをクリックします。
注: プロモート後にスペース内のモデルに移動するオプションを選択しなかった場合は、ナビゲーション・メニューを使用して 「デプロイメント」 にナビゲートし、デプロイメント・スペースとモデルを選択できます。モデルを開いた状態で、 「新規デプロイメント」をクリックします。
デプロイメント・タイプとして オンライン を選択してください。
デプロイメントの名前を指定します。
「作成」 をクリックします。
デプロイメントが完了したら、デプロイメント名をクリックして、デプロイメントの詳細ページを表示します。
進捗状況を確認する
以下のイメージは、新規デプロイメントを示しています。
タスク 4: デプロイされたモデルのテスト
このタスクをプレビューするには、06:22から始まるビデオをご覧ください。
モデルがデプロイされたので、ユーザーインターフェースまたはwatsonx.aiRuntime API を使ってオンラインデプロイメントをテストできます。 ユーザー・インターフェースを使用して新規データでモデルをテストするには、以下の手順を実行します。
「テスト」 タブをクリックします。 デプロイされたモデルは、デプロイメントの詳細ページから 2 つの方法でテストできます:1 つはフォームを使用してテストし、もう 1 つは JSON コードを使用してテストします。
「JSON 入力」 タブをクリックし、以下のテスト・データをコピーして貼り付け、既存の JSON テキストを置き換えます。
{ "input_data": [ { "fields": [ "age", "job", "marital", "education", "default", "balance", "housing", "loan", "contact", "day", "month", "duration", "campaign", "pdays", "previous", "poutcome" ], "values": [ [ 27, "unemployed", "married", "primary", "no", 1787, "no", "no", "cellular", 19, "oct", 79, 1, -1, 0, "unknown" ] ] } ] }
指定した属性を持つ顧客が特定の種類のアカウントに登録する可能性が高いかどうかを予測するには、 予測 をクリックしてください。 結果の予測は、この顧客がマーケティング・プロモーションに登録しない可能性が高いことを示しています。
「X」 をクリックして、 「予測結果」 ウィンドウを閉じます。
進捗状況を確認する
以下のイメージは、デプロイメントのテスト結果を示しています。 予測の値は、以下の画像の値とは異なる場合があります。
タスク 5: モデルをスコアリングするバッチ・ジョブの作成
これで、デプロイされたモデルを単一の予測でテストしたので、バッチ・デプロイメントを作成して、複数のレコードを同時にスコアリングすることができます。
タスク 5a: バッチ・デプロイメントのセットアップ
このタスクをプレビューするには、 07:00から始まるビデオをご覧ください。
バッチ・デプロイメントの場合は、モデル・ペイロードとも呼ばれる入力データを CSV ファイルで提供します。 データは、同じ列ヘッダーを持つトレーニング・データと同様に構造化されている必要があります。 バッチ・ジョブは、データの各行を処理し、対応する予測を作成します。 ペイロード・データをデプロイメント・スペースにアップロードするには、以下の手順を実行します。
以下のテキストをコピーしてテキスト・エディターに貼り付け、ファイルを
bank-payload.csv
として保存します。age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome 30,unemployed,married,primary,no,1787,no,no,cellular,19,oct,79,1,-1,0,unknown 33,services,married,secondary,no,4789,yes,yes,cellular,11,may,220,1,339,4,failure 35,management,single,tertiary,no,1350,yes,no,cellular,16,apr,185,1,330,1,failure 30,management,married,tertiary,no,1476,yes,yes,unknown,3,jun,199,4,-1,0,unknown 59,blue-collar,married,secondary,no,0,yes,no,unknown,5,may,226,1,-1,0,unknown 35,management,single,tertiary,no,747,no,no,cellular,23,feb,141,2,176,3,failure 36,self-employed,married,tertiary,no,307,yes,no,cellular,14,may,341,1,330,2,other 39,technician,married,secondary,no,147,yes,no,cellular,6,may,151,2,-1,0,unknown 41,entrepreneur,married,tertiary,no,221,yes,no,unknown,14,may,57,2,-1,0,unknown 43,services,married,primary,no,-88,yes,yes,cellular,17,apr,313,1,147,2,failure 39,services,married,secondary,no,9374,yes,no,unknown,20,may,273,1,-1,0,unknown 43,admin.,married,secondary,no,264,yes,no,cellular,17,apr,113,2,-1,0,unknown 36,technician,married,tertiary,no,1109,no,no,cellular,13,aug,328,2,-1,0,unknown 20,student,single,secondary,no,502,no,no,cellular,30,apr,261,1,-1,0,unknown 31,blue-collar,married,secondary,no,360,yes,yes,cellular,29,jan,89,1,241,1,failure 40,management,married,tertiary,no,194,no,yes,cellular,29,aug,189,2,-1,0,unknown 56,technician,married,secondary,no,4073,no,no,cellular,27,aug,239,5,-1,0,unknown 37,admin.,single,tertiary,no,2317,yes,no,cellular,20,apr,114,1,152,2,failure 25,blue-collar,single,primary,no,-221,yes,no,unknown,23,may,250,1,-1,0,unknown 31,services,married,secondary,no,132,no,no,cellular,7,jul,148,1,152,1,other
ナビゲーション・トレールでデプロイメント・スペースをクリックします。
「資産」タブをクリックします。
bank-payload.csv ファイルをサイド・パネルにドラッグし、ファイルがアップロードされるのを待ちます。
進捗状況を確認する
以下のイメージは、デプロイメント・スペースの 「資産」 タブを示しています。
タスク 5b: バッチ・デプロイメントの作成
このタスクをプレビューするには、 07:30から始まるビデオをご覧ください。
入力バッチを処理し、出力をリアルタイムで表示する代わりにファイルに書き込むには、バッチ・デプロイメント・ジョブを作成します。
デプロイメント・スペースの 「資産」 タブに移動します。
モデルのオーバーフローメニュー「クリックし、デプロイを選択します。
「デプロイメント・タイプ」で、 「バッチ」を選択します。
デプロイメントの名前を入力します。
最小のハードウェア仕様を選択します。
「作成」 をクリックします。
進捗状況を確認する
以下の画像は、バッチ・デプロイメントを示しています。
タスク 5c: バッチ・ジョブの作成
このタスクをプレビューするには、07:44から始まるビデオをご覧ください。
バッチ・ジョブがデプロイメントを実行します。 ジョブを作成するには、入力データと出力ファイルの名前を指定します。 ジョブをスケジュールに従って実行するか、または即時に実行するように設定できます。 バッチ・ジョブを作成するには、以下の手順を実行します。
デプロイメント・ページで、 「新規ジョブ」をクリックします。
ジョブの名前を指定して、 「次へ」をクリックします。
最小のハードウェア仕様を選択し、 「次へ」をクリックします。
オプション: スケジュールを設定し、 「次へ」をクリックします。
オプション: 通知を受け取ることを選択し、 「次へ」をクリックします。
「データの選択」 画面で、 「入力」 データを選択します。
「データ・ソースの選択」をクリックします。
「データ資産」> bank-payload.csvを選択します。
「確認 (Confirm)」をクリックします。
「データの選択」 画面に戻り、 「出力」 ファイルを指定します。
追加 をクリックします。
「データ・ソースの選択」をクリックします。
「新規作成」 タブが選択されていることを確認します。
名前の場合は、
bank-output.csv
と入力します。「確認 (Confirm)」をクリックします。
最後のステップの 「次へ」 をクリックします。
設定を確認し、 「作成して実行」 をクリックしてジョブを即時に実行します。
進捗状況を確認する
以下のイメージは、バッチ・デプロイメントのジョブの詳細を示しています。
タスク 5d: 出力の表示
このタスクをプレビューするには、08:42から始まるビデオをご覧ください。
バッチ・ジョブからの出力ファイルを確認するには、以下のステップを実行します。
状況を確認するには、ジョブ名をクリックします。
状況が 「完了」に変わったら、ナビゲーション・トレールでデプロイメント・スペース名をクリックします。
「資産」タブをクリックします。
bank-output.csv ファイルをクリックして、バッチ処理のために送信された顧客情報の予測結果を確認します。 いずれの場合も、これらの顧客が銀行のプロモーションをサブスクライブする可能性は低いと予測されます。
進捗状況を確認する
次の図は、バッチ・デプロイメント・ジョブの結果を示しています。
次のステップ
これで、このデータ・セットをさらに分析するために使用できます。 例えば、ユーザーまたは他のユーザーは、以下のいずれかのタスクを実行できます:
その他のリソース
これらの追加チュートリアルを試して、モデル構築の実践的な経験を積んでください。AutoAI:
モデルを作成するには、以下の他の方法を試してください。
その他の ビデオ を見る
リソース・ハブでモデル構築の実践的な経験を積むためのサンプル・データセットを探す
親トピック: クイック・スタート・チュートリアル