AutoAI ツールを使用して、機械学習モデルの作成プロセスを自動化できます。 AutoAI ツールについて読み、ビデオを見て初心者向けのチュートリアルを受けます。コーディングは必要ありません。
基本的なワークフローには、以下のタスクが含まれます:
- サンドボックスプロジェクトを開く。 プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
- データをプロジェクトに追加します。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
- プロジェクトで AutoAI エクスペリメントを作成します。
- モデル・パイプラインを確認し、デプロイするモデルとして、またはカスタマイズするノートブックとして、目的のパイプラインを保存します。
- モデルをデプロイしてテストします。
AutoAI について読む
AutoAI グラフィカル・ツールは、データを自動的に分析し、予測モデリング問題用にカスタマイズされたモデル・パイプラインの候補を生成します。 これらのモデル・パイプラインは、AutoAI がデータ・セットを分析し、問題設定に最適なデータ変換、アルゴリズム、およびパラメーター設定を検出するときに、繰り返し作成されます。 結果はリーダーボードに表示され、自動的に生成されたモデル・パイプラインが、ユーザーの問題最適化目標に従ってランク付けされた順序で示されます。
AutoAI を使用してモデルの作成に関するビデオを見る
このビデオを見て、銀行マーケティング・サンプルに基づいて AutoAI エクスペリメントを作成して実行する方法を確認してください。
このビデオは、このドキュメントのコンセプトとタスクを学ぶための視覚的な方法を提供します。
AutoAI を使用してチュートリアルを受けてモデルを作成する
このチュートリアルでは、マーケティング・キャンペーンに基づいて、顧客が定期預金に申し込む可能性があるかどうかを予測するモデルのトレーニングについて説明します。
このチュートリアルでは、以下のタスクを実行します:
- タスク1:プロジェクトを開く。
- タスク2:モデルの構築とトレーニング
- タスク3:モデルをデプロイメント空間にプロモートし、学習済みモデルをデプロイする
- タスク4:デプロイされたモデルをテストする
- タスク5:モデルを採点するバッチジョブを作成する
このチュートリアルを完了するための所要時間は約 30 分です。
サンプルデータ
ガイド付きエクスペリエンスで使用されるサンプルデータは、UCI:顧客がマーケティングプロモーションに登録するかどうかを予測するために使用される銀行のマーケティングデータです。
このチュートリアルを完了するためのヒント
このチュートリアルを成功させるためのヒントを紹介します。
ビデオのピクチャー・イン・ピクチャーを使う
次のアニメーション画像は、ビデオのピクチャー・イン・ピクチャーと目次機能の使い方を示しています:
地域の助けを借りる
このチュートリアルで助けが必要な場合は、watsonxコミュニティーのディスカッション・フォーラムで質問したり、答えを見つけることができます。
ブラウザのウィンドウを設定する
このチュートリアルを最適に完了するには、Cloud Pak for Data を 1 つのブラウザ ウィンドウで開き、このチュートリアルのページを別のブラウザ ウィンドウで開いておくと、2 つのアプリケーションを簡単に切り替えることができます。 2つのブラウザウィンドウを横に並べると、より見やすくなります。
タスク 1:プロジェクトを開く
データとAutoAI実験を保存するプロジェクトが必要です。 サンドボックス・プロジェクトを使うことも、プロジェクトを作成することもできる。
ナビゲーションメニュー「」から、「プロジェクト」 > 「すべてのプロジェクトを表示」を選択する
サンドボックスプロジェクトを開く。 新しいプロジェクトを使いたい場合:
新規プロジェクトをクリックしてください。
「空のプロジェクトの作成」を選択します。
プロジェクトの名前と任意の説明を入力します。
既存の オブジェクト・ストレージ・サービス・インスタンス を選択するか、または新規作成します。
「作成」 をクリックします。
プロジェクトが開始したら、 管理 タブをクリックし、 サービスと統合 ページを選択してください。
IBM servicesタブで、Associateサービスをクリックします。
watsonx.aiランタイムインスタンスを選択します。 watsonx.aiRuntime サービスインスタンスがまだプロビジョニングされていない場合は、以下の手順に従ってください:
新規サービスをクリックします。
watsonx.aiランタイムを選択します。
「作成」 をクリックします。
リストから新しいサービス・インスタンスを選択する。
サービスを関連付けるをクリックします。
必要に応じて、キャンセルをクリックし、サービス & 統合ページに戻ります。
詳細またはビデオについては、プロジェクトの作成をご覧ください。
進捗状況を確認する
以下の画像は新しいプロジェクトを示しています
タスク2:モデルの構築とトレーニング
このタスクをプレビューするには、00:08から始まるビデオをご覧ください。
プロジェクトができたので、AutoAI を使ってモデルを構築し、トレーニングする準備ができました。 以下の手順に従って、AutoAI 実験を作成し、モデルパイプラインを確認し、モデルとして保存するパイプラインを選択します:
プロジェクトのアセットタブをクリックし、新規アセット>機械学習モデルを自動的に構築をクリックします。
機械学習モデルを自動的に構築するページで、基本的な項目を入力する:
リソースハブサンプルパネルをクリックします。
バンクマーケティングサンプルデータを選択し、次へをクリックします。 プロジェクト名と説明が自動的に入力されます。
プロジェクトに関連付けた「watsonx.aiランタイムサービスインスタンスが「watsonx.aiランタイム・サービス・インスタンスフィールドで選択されていることを確認します。
「作成」 をクリックします。
このサンプルAutoAI実験では、銀行マーケティングサンプルデータがすでに実験用に選択されていることがわかります。
プリセットの実験設定を見直す。 AutoAI は、データ・セットと、予測対象として選択された列に基づいて、データのサブセットを分析し、最適化する予測タイプとメトリックを選択します。 この場合、予測タイプはBinary Classification、ポジティブ・クラスはYes、最適化されたメトリックはROC AUC & run timeです。
「エクスペリメントの実行 (Run experiment)」をクリックします。 モデルがトレーニングすると、パイプラインの構築過程を示すインフォグラフィックが表示される。
'AutoAI の各機械学習手法で使用可能なアルゴリズム または推定法のリストについては、 AutoAI 実装の詳細を参照してください。
実験が完了すると、ランキングされたパイプラインをリーダーボードで表示し、比較することができます。
パイプラインの比較をクリックすると、両者の違いを見ることができる。
最高ランクのパイプラインをクリックすると、パイプラインの詳細が表示されます。
Save asをクリックし、Modelを選択し、Createをクリックします。 これにより、パイプラインがモデルとしてプロジェクトに保存されます。
モデルが保存されたら、通知内の プロジェクトで表示 リンクをクリックして、プロジェクト内のモデルを表示します。 あるいは、プロジェクトの資産タブに移動し、モデルセクションでモデル名をクリックすることもできます。
進捗状況を確認する
以下の画像はモデルを示している
タスク3:モデルを展開空間にプロモートし、学習済みモデルを展開する
このタスクをプレビューするには、 04:57から始まるビデオをご覧ください。
モデルを配置する前に、モデルを配置スペースにプロモートする必要があります。 以下の手順に従って、モデルを配置スペースに昇格し、モデルを配置します:
配備促進スペースアイコン「」をクリックする。
既存のデプロイメント・スペースを選択してください。 もし配置スペースがなければ:
新しい配置スペースを作成をクリックします。
スペース名とオプションの説明を提供します。
ストレージ・サービスを選択してください。
機械学習サービスを選択してください。
「作成」 をクリックします。
閉じるをクリックします。
リストから新しい配置スペースを選択します。
プロモーション後、スペース内のモデルに移動するオプションを選択します。
プロモートをクリックします。
注意:プロモーション後にスペース内のモデルに移動するオプションを選択しなかった場合は、ナビゲーション メニューを使用して デプロイメントに移動し、デプロイメント スペースとモデルを選択できます。モデルを開いた状態で、新規配置をクリックします。
デプロイメント・タイプとして オンライン を選択してください。
デプロイメントの名前を指定します。
「作成」 をクリックします。
デプロイメントが完了したら、デプロイメント名をクリックして、デプロイメントの詳細ページを表示します。
進捗状況を確認する
以下の画像は新しい配置を示しています
タスク4:展開されたモデルのテスト
このタスクをプレビューするには、06:22から始まるビデオをご覧ください。
モデルがデプロイされたので、ユーザーインターフェースまたはwatsonx.aiRuntime API を使ってオンラインデプロイメントをテストできます。 以下の手順に従って、ユーザーインターフェイスを使用して、新しいデータでモデルをテストしてください:
テストタブをクリックします。 デプロイされたモデルは、デプロイメントの詳細ページから 2 つの方法でテストできます:1 つはフォームを使用してテストし、もう 1 つは JSON コードを使用してテストします。
JSON入力タブをクリックし、以下のテストデータをコピーして、既存のJSONテキストを置き換えるために貼り付けます:
{ "input_data": [ { "fields": [ "age", "job", "marital", "education", "default", "balance", "housing", "loan", "contact", "day", "month", "duration", "campaign", "pdays", "previous", "poutcome" ], "values": [ [ 27, "unemployed", "married", "primary", "no", 1787, "no", "no", "cellular", 19, "oct", 79, 1, -1, 0, "unknown" ] ] } ] }
指定した属性を持つ顧客が特定の種類のアカウントに登録する可能性が高いかどうかを予測するには、 予測 をクリックしてください。 結果の予測は、この顧客がマーケティング・プロモーションに登録しない可能性が高いことを示しています。
Xをクリックして、予測結果ウィンドウを閉じます。
進捗状況を確認する
以下の画像は、配備をテストした結果である。
あなたの予測の値は、以下の画像の値とは異なるかもしれません
タスク5:モデルを採点するバッチジョブの作成
デプロイされたモデルを1つの予測でテストしたので、複数のレコードを同時にスコアリングするバッチデプロイメントを作成できます。
タスク 5a: バッチデプロイメントの設定
このタスクをプレビューするには、 07:00から始まるビデオをご覧ください。
バッチ・デプロイメントの場合は、モデル・ペイロードとも呼ばれる入力データを CSV ファイルで提供します。 データは、同じ列ヘッダーを持つトレーニング・データと同様に構造化されている必要があります。 バッチジョブはデータの各行を処理し、対応する予測を作成する。 以下の手順に従って、ペイロードデータを配置スペースにアップロードします:
以下のテキストをコピーしてテキストエディタに貼り付け、
bank-payload.csv
としてファイルを保存する。age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome 30,unemployed,married,primary,no,1787,no,no,cellular,19,oct,79,1,-1,0,unknown 33,services,married,secondary,no,4789,yes,yes,cellular,11,may,220,1,339,4,failure 35,management,single,tertiary,no,1350,yes,no,cellular,16,apr,185,1,330,1,failure 30,management,married,tertiary,no,1476,yes,yes,unknown,3,jun,199,4,-1,0,unknown 59,blue-collar,married,secondary,no,0,yes,no,unknown,5,may,226,1,-1,0,unknown 35,management,single,tertiary,no,747,no,no,cellular,23,feb,141,2,176,3,failure 36,self-employed,married,tertiary,no,307,yes,no,cellular,14,may,341,1,330,2,other 39,technician,married,secondary,no,147,yes,no,cellular,6,may,151,2,-1,0,unknown 41,entrepreneur,married,tertiary,no,221,yes,no,unknown,14,may,57,2,-1,0,unknown 43,services,married,primary,no,-88,yes,yes,cellular,17,apr,313,1,147,2,failure 39,services,married,secondary,no,9374,yes,no,unknown,20,may,273,1,-1,0,unknown 43,admin.,married,secondary,no,264,yes,no,cellular,17,apr,113,2,-1,0,unknown 36,technician,married,tertiary,no,1109,no,no,cellular,13,aug,328,2,-1,0,unknown 20,student,single,secondary,no,502,no,no,cellular,30,apr,261,1,-1,0,unknown 31,blue-collar,married,secondary,no,360,yes,yes,cellular,29,jan,89,1,241,1,failure 40,management,married,tertiary,no,194,no,yes,cellular,29,aug,189,2,-1,0,unknown 56,technician,married,secondary,no,4073,no,no,cellular,27,aug,239,5,-1,0,unknown 37,admin.,single,tertiary,no,2317,yes,no,cellular,20,apr,114,1,152,2,failure 25,blue-collar,single,primary,no,-221,yes,no,unknown,23,may,250,1,-1,0,unknown 31,services,married,secondary,no,132,no,no,cellular,7,jul,148,1,152,1,other
ナビゲーショントレイルで配置スペースをクリックします。
「資産」タブをクリックします。
bank-payload.csv ファイルをサイドパネルにドラッグし、ファイルがアップロードされるのを待ちます。
進捗状況を確認する
以下の画像は、デプロイメントスペースの資産タブを示しています。
タスク 5b: バッチデプロイメントの作成
このタスクをプレビューするには、 07:30から始まるビデオをご覧ください。
入力バッチを処理し、出力をリアルタイムで表示する代わりにファイルに書き込むには、バッチ・デプロイメント・ジョブを作成します。
配置スペースの資産タブに移動します。
モデルのオーバーフローメニュー「クリックし、「Deploy」を選択します。
Deployment typeでは、Batchを選択します。
配置の名前を入力します。
最小のハードウェア仕様を選択します。
「作成」 をクリックします。
進捗状況を確認する
バッチデプロイメントを以下の画像に示します
タスク 5c: バッチジョブの作成
このタスクをプレビューするには、07:44から始まるビデオをご覧ください。
バッチジョブは配備を実行する。 ジョブを作成するには、入力データと出力ファイル名を指定します。 ジョブをスケジュールに従って実行するか、または即時に実行するように設定できます。 バッチジョブを作成するには、以下の手順に従ってください:
デプロイメントページで、新規ジョブをクリックします。
ジョブ名を指定し、次へをクリックします。
最小のハードウェア仕様を選択し、次へをクリックします。
オプション:スケジュールを設定し、次へをクリックします。
オプション:通知を受け取ることを選択し、次へをクリックします。
データを選択画面で、入力データを選択する:
データソースを選択をクリックします。
Data asset > bank-payload.csv を選択します。
「確認 (Confirm)」をクリックします。
データの選択画面に戻り、出力ファイルを指定する:
追加 をクリックします。
データソースを選択をクリックします。
新規作成タブが選択されていることを確認する。
名前の場合は、
bank-output.csv
と入力します。「確認 (Confirm)」をクリックします。
最後のステップは次へをクリックします。
設定を確認し、Create and runをクリックしてすぐにジョブを実行します。
進捗状況を確認する
次の画像はバッチデプロイのジョブ詳細を示しています
タスク 5d: 出力を見る
このタスクをプレビューするには、08:42から始まるビデオをご覧ください。
以下の手順に従って、バッチジョブの出力ファイルを確認してください。
ジョブ名をクリックするとステータスが表示されます。
ステータスが Completed に変わったら、ナビゲーション トレイルで配置スペース名をクリックします。
「資産」タブをクリックします。
bank-output.csv ファイルをクリックして、バッチ処理のために送信された顧客情報の予測結果を確認します。 いずれの場合も、これらの顧客が銀行のプロモーションをサブスクライブする可能性は低いと予測されます。
進捗状況を確認する
バッチデプロイジョブの結果を以下の画像に示します
今後のステップ
これで、このデータ・セットをさらに分析するために使用できます。 例えば、ユーザーまたは他のユーザーは、以下のいずれかのタスクを実行できます:
その他のリソース
AutoAI:を使用したモデルの構築について、より実践的な経験を積むには、以下の追加チュートリアルをお試しください
模型を作る他の方法を試してみよう:
詳しくは、 ビデオを参照してください。
サンプルデータセット、プロジェクト、モデル、プロンプト、ノートブックをリソースハブで見つけて、実践的な経験を積むことができます:
ノートブックをプロジェクトに追加することで、データの分析やモデルの構築を始めることができます。
ノートブック、データセット、プロンプト、その他のアセットを含むインポート可能なプロジェクト。
プロジェクトを改良、分析、モデル構築するために追加できるデータセット。
プロンプト 。プロンプト・ラボで基盤モデルのプロンプトを出すために使用できます。
プロンプト・ラボで使用できる 基盤モデル 。
親トピック: クイック・スタート・チュートリアル