クイック・スタート: AutoAI を使用して機械学習モデルを作成とデプロイする

AutoAI ツールを使用して、機械学習モデルの作成プロセスを自動化できます。 AutoAI ツールについて読み、ビデオを見て初心者向けのチュートリアルを受けます。コーディングは必要ありません。

必須サービス Watson Machine Learning

基本的なワークフローには、以下のタスクが含まれます:

  1. プロジェクトを作成する プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
  2. データをプロジェクトに追加します。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
  3. プロジェクトで AutoAI エクスペリメントを作成します。
  4. モデル・パイプラインを確認し、デプロイするモデルとして、またはカスタマイズするノートブックとして、目的のパイプラインを保存します。
  5. モデルをデプロイしてテストします。

AutoAI について読む

Watson Studio の AutoAI グラフィカル・ツールは、自動的にデータを分析し、予測モデリング問題に対応できるようにカスタマイズされた候補モデル・パイプラインを生成します。 これらのモデル・パイプラインは、AutoAI がデータ・セットを分析し、問題設定に最適なデータ変換、アルゴリズム、およびパラメーター設定を検出するときに、繰り返し作成されます。 結果はリーダーボードに表示され、自動的に生成されたモデル・パイプラインが、ユーザーの問題最適化目標に従ってランク付けされた順序で示されます。

AutoAI の詳細を読む

モデルを構築する他の方法について説明します

AutoAI を使用してモデルの作成に関するビデオを見る

ビデオを見る このビデオを見て、銀行マーケティング・サンプルに基づいて AutoAI エクスペリメントを作成して実行する方法を確認してください。

このビデオでは、本書に記載されている手順に従う代わりの方法として、視覚方式を提供します。

  • 時間 トランスクリプト
    00:00 このビデオでは、サンプルの AutoAI エクスペリメントを実行して Watson Machine Learning モデルを作成する方法を示します。
    00:08 Watson Studio プロジェクトで開始し、そのプロジェクトに新しい AutoAI エクスペリメントを追加します。
    00:16 AutoAI エクスペリメントを実行するには、 Watson Machine Learning サービスが必要です。
    00:22 ここで、 Watson Machine Learning サービスをこのプロジェクトに関連付けるオプションがあります。
    00:29 新規サービス・インスタンスを作成することも、既存のサービス・インスタンスを選択することもできます。
    00:39 エクスペリメントを作成しているページに戻ると、ページを再ロードするだけで、新しいサービス・インスタンスがリストされます。
    00:48 この最初のエクスペリメントでは、サンプルを選択します。
    00:52 「銀行マーケティング」サンプルには、マーケティング・キャンペーンに対応して銀行への電話から収集されたテキスト・データが含まれています。
    01:01 サンプルを選択すると、エクスペリメントの名前と説明が自動的に入力されるため、エクスペリメントを作成する準備が整います。
    01:11 次に、AutoAI エクスペリメント・ビルダーが表示されます。
    01:15 このエクスペリメントはサンプルからのものであるため、銀行のマーケティング・ソース・ファイルは既に選択されています。
    01:22 また、予測する列も既に選択されています。
    01:26 この場合、「y」列は、ユーザーがマーケティング・キャンペーンの一環として定期預金を申し込むかどうかを表します。
    01:35 AutoAI は、データ・セットと、予測対象として選択された列に基づいて、データのサブセットを分析し、最適化する予測タイプとメトリックを選択します。
    01:47 この場合、予測する列に「Y」または「N」(「はい」または「いいえ」) の値が含まれているため、二項分類が選択されました。
    01:57 正のクラスは「Yes」で、最適化されたメトリックは ROC AUC です。
    02:03 ROC AUC メトリックは、精度、確度、および再現率のバランスを取ります。
    02:10 では、エクスペリメントを実行し、「パイプライン・リーダーボード」が埋まるのを待ちます。
    02:17 AutoAI トレーニング中に、データ・セットはトレーニング・データとホールドアウト・データの 2 つの部分に分割されます。
    02:24 トレーニング・データは AutoAI トレーニング・ステージによってモデル・パイプラインを生成するために使用され、またクロス検証スコアはトレーニング後にそれらをランク付けするために使用されます。
    02:34 トレーニング後、ホールドアウト・データは、結果のパイプライン・モデルの評価およびパフォーマンス情報 (例:ROC 曲線やコンフュージョン・マトリックスなど) の計算に使用されます。
    02:48 次に、AutoAI は、XGBoost 分類器などの様々な推定器や、ハイパーパラメータ最適化や特徴工学などの機能拡張を用いたパイプラインを生成し、そのパイプラインを確度指標に基づいてランク付けします。
    03:06 ハイパーパラメーターの最適化は、潜在的なハイパーパラメーターの探索スペースを自動的に探索し、一連のモデルを作成し、関心のあるメトリックを使用してモデルを比較するためのメカニズムです。
    03:20 特徴量エンジニアリングは、問題を最も適切に表す特徴量の組み合わせに生データを変換することで、最も正確な予測を実現することを試みます。
    03:31 さて、実行が完了しました。
    03:34 凡例では、関係マップ上のデータ、上位アルゴリズム、パイプライン、およびフィーチャー・トランスフォーマーの場所を説明します。
    03:44 完全なログを表示して、完全な詳細を確認できます。
    03:48 デフォルトでは「関係マップ」を閲覧できますが、ビューをスワップして「進行状況マップ」を見ることができます。
    03:57 スクロールダウンして、リーダーボードを確認します。
    04:01 パイプラインの比較から開始することをお勧めします。
    04:05 このグラフは、8つのパイプラインの指標を提供し、クロス検証スコアまたはホールドアウト・スコアで表示されました。
    04:13 平均精度など、他のメトリックに基づいてランク付けされたパイプラインを確認できます。
    04:21 「実験の要約」タブに戻り、パイプラインを展開して、モデル評価指標と ROC 曲線を表示します。
    04:30 個々のパイプラインを閲覧して、混同行列、精度再現曲線、モデル情報、特徴量変換、および特徴量重要度に加えて、より詳細な情報を確認することができます。
    04:49 このパイプラインのランキングが最も高かったため、これを機械学習モデルとして保存できます。
    04:55 デフォルトを受け入れて、モデルを保存するだけです。
    05:01 モデルのトレーニングが完了したので、モデルを閲覧してデプロイする準備ができました。
    05:06 「概要」タブには、モデルの要約と入力スキーマが表示されます。
    05:12 モデルをデプロイするには、これをデプロイメント・スペースにプロモートする必要があります。
    05:17 このプロジェクトにはまだデプロイメント・スペースが関連付けられていないため、まず関連付けをセットアップする必要があります。
    05:25 既存のデプロイメント・スペースを選択することも、新規デプロイメント・スペースを作成することもできます。
    05:31 新規スペースを作成する場合は、名前と説明を提供し、 Cloud Object Storage サービスと Watson Machine Learning サービスを選択するだけです。
    05:41 次に、スペースを作成します。
    05:45 この新しいスペースを選択し、モデルの説明を追加して、「プロモート」をクリックしてください。
    05:53 リンクを使用してデプロイメント・スペースに移動します。
    06:00 これが先ほど作成したモデルです、これをデプロイすることができます。
    06:04 この場合、オンライン・デプロイメントになります。
    06:08 デプロイメントの名前を提供し、「作成」をクリックしてください。
    06:12 その後、モデルがデプロイされるまで待ちます。
    06:16 モデルのデプロイメントが完了したら、デプロイメントを表示します。
    06:20 「API リファレンス」タブに、今後の参考のために、スコアリング・エンドポイントが記載されています。
    06:26 また、アプリケーションからこのデプロイメントを使用するために、さまざまなプログラミング言語のコード・スニペットも記載しています。
    06:35 「テスト」タブで、モデル予測をテストできます。
    06:40 テスト入力データを入力するか、または JSON 入力データを貼り付けて、「予測」をクリックすることができます。
    06:52 これは、最初の人が定期預金に加入しない可能性が非常に高く、2 番目の人が定期預金に加入する可能性が高いことを示しています。
    07:06 プロジェクトに戻ると、「資産」タブに AutoAI エクスペリメントとモデルが表示されます。
    07:17 Cloud Pak for Data as a Service の資料には他にもビデオがあります。

AutoAI を使用してチュートリアルを受けてモデルを作成する

このチュートリアルでは、以下を行います。

  • プロジェクトを作成する
  • Watson Machine Learning サービスをプロジェクトに関連付けます。
  • プロジェクトで AutoAI エクスペリメントを作成します。
  • モデルを作成してトレーニングします。
  • パイプラインをモデルとして保存します。
  • モデルをデプロイします。
  • モデルをテストします。

このチュートリアルを完了するための所要時間は約 30 分です。

サンプル・データ

ガイド付きエクスペリエンスで使用されるサンプル・データは、顧客がマーケティング・プロモーションに登録するかどうかを予測するために使用される 銀行マーケティング データです。 エクスペリメントの基礎として ギャラリー・サンプル を選択する時、データが自動的にアップロードされ、使用できるようになります。

ステップ 1: プロジェクトを作成し、 Watson Machine Learning サービスを関連付ける

{: #step1} AutoAI エクスペリメントを保存するためのプロジェクトが必要です。

  1. 既存のプロジェクトを持っている場合は、それを開きます。 既存のプロジェクトを持っていない場合は、ホーム・ページで プロジェクトの作成 をクリックするか、 またはプロジェクト ページで 新規プロジェクト をクリックしてください。
  2. 「空のプロジェクトの作成」を選択します。
  3. プロジェクトの作成 画面で、プロジェクトの名前と説明 (オプション) を追加してください。
  4. 既存の オブジェクト・ストレージ・サービス・インスタンス を選択するか、または新規作成します。

  5. 「作成」をクリックします。

  6. プロジェクトが開始したら、 管理 タブをクリックし、 サービスと統合 ページを選択してください。

  7. IBM サービス セクションで、 サービスの関連付けをクリックしてください。
  8. Watson Machine Learning サービス・インスタンスがまだプロビジョンされていない場合は、 新規サービスをクリックし、「Machine Learning」を選択し、 作成をクリックしてください。
  9. Watson Machine Learning インスタンスを選択し、 サービスの関連付けをクリックしてください。
  10. サービスの関連付け ダイアログ・ボックスを閉じます。

詳細について、またはビデオを見るには、 プロジェクトの作成を参照してください。
関連サービスについて詳しくは、 関連付けられたサービスの追加を参照してください。

ステップ 2: モデルを作成してトレーニングする

{: #step2} AutoAI エクスペリメントを作成し、モデル・パイプラインを確認し、パイプラインを選択してモデルとして保存します。

  1. プロジェクトの 資産 タブから、 「新規アセット」>「 AutoAI エクスペリメント」をクリックしてください。
  2. 開いたページで、以下のように基本フィールドに入力します。
    1. ギャラリー・サンプルをクリックし、 銀行マーケティングのサンプル・データを選択してください。 プロジェクト名と説明が自動的に入力されます。
    2. プロジェクトに関連付けた Machine Learning サービス・インスタンスが 機械学習サービス セクションで選択されていることを確認します。
  3. 「作成」をクリックします。
  4. このサンプル AutoAI エクスペリメントでは、 銀行マーケティングのサンプル・データ が既にエクスペリメント用に選択されていることが分かります。
  5. 「Y」とラベル付けた列がモデルに対して自動的に選択されます。 この列は、顧客がマーケティング・プロモーションに登録する可能性があるかどうかを予測するために使用されます。 AutoAI はデータを分析し、Y 列に True/False 情報が含まれていることを確認し、このデータを二項分類モデルに適したものにします。 二項分類のデフォルト・メトリックは ROC/AUC です。
  6. AutoAI は、データ・セットと、予測対象として選択された列に基づいて、データのサブセットを分析し、最適化する予測タイプとメトリックを選択します。 この場合、予測タイプは 二項分類、正のクラスは Yes、最適化されたメトリックは ROC AUC (R)です。
  7. 「実験の実行 (Run experiment)」をクリックします。 モデルのトレーニングが進むにつれて、パイプラインの構築プロセスを示すインフォグラフィックが表示されます。
  8. パイプラインの作成が完了すると、リーダーボードでランク付けされたパイプラインを閲覧して比較することができます。
  9. ランクが最も高いパイプラインを選択し、アクション・メニューから モデルの保存 を選択してください。 これにより、パイプラインが Machine Learning 資産としてプロジェクトに保存されます。
  10. モデルが保存されたら、通知内の プロジェクトで表示 リンクをクリックして、プロジェクト内のモデルを表示します。 あるいは、プロジェクトの 資産 タブにナビゲートし、 機械学習モデル セクションでモデル名をクリックすることもできます。

ステップ 3: モデルをデプロイメント・スペースにプロモートし、トレーニング済みモデルをデプロイする

これで、モデルをデプロイメント・スペースにプロモートして、モデルをデプロイできます。

  1. デプロイメント・スペースへのプロモートをクリックしてください。
  2. 既存のデプロイメント・スペースを選択してください。 デプロイメント・スペースを持っていない場合は、新しいデプロイメント・スペースを作成できます:
    1. スペース名とオプションの説明を提供します。
    2. ストレージ・サービスを選択してください。
    3. 機械学習サービスを選択してください。
    4. 「作成」をクリックします。
    5. 「閉じる」をクリックします。
  3. プロモートをクリックします。
  4. モデルがプロモートされたら、通知内の デプロイメント・スペース リンクをクリックして、プロジェクト内のモデルを表示します。 あるいは、ナビゲーション・メニューを使用して デプロイメントにナビゲートし、デプロイメント・スペース名をクリックすることもできます。
  5. モデル名の横にある デプロイ アイコンをクリックしてください。
    1. デプロイメント・タイプとして オンライン を選択してください。
    2. デプロイメントの名前を指定します。
    3. 「作成」をクリックします。
  6. デプロイメント タブをクリックし、モデルがデプロイされるまで待ちます。
  7. デプロイメントが完了したら、デプロイメント名をクリックして、デプロイメントの詳細ページを表示します。

ステップ 4: デプロイされたモデルをテストする

{: #step4} デプロイメントを使用して、新規データを使用してモデルをテストします。

  1. 「テスト」タブをクリックします。 デプロイされたモデルは、デプロイメントの詳細ページから 2 つの方法でテストできます:1 つはフォームを使用したテスト、もう 1 つは JSON コードを使用したテストです。
  2. 入力データを JSON として提供のアイコンをクリックしてから、以下のテスト・データをコピーし、JSON テキストのところに貼り付けます:

    {"input_data":[{
            "fields": ["age","job","marital","education","default","balance","housing","loan","contact","day", "month","duration","campaign","pdays","previous","poutcome"],
            "values": [[27,"unemployed", "married", "primary", "no",1787,"no", "no","cellular",19,"oct", 79, 1, -1, 0, "unknown" ]]
    }]}
    
  3. 指定した属性を持つ顧客が特定の種類のアカウントに登録する可能性が高いかどうかを予測するには、 予測 をクリックしてください。 結果の予測は、この顧客がマーケティング・プロモーションに登録しない可能性が高いことを示しています。

次のステップ

これで、このデータ・セットをさらに分析するために使用できます。 例えば、ユーザーまたは他のユーザーは、以下のいずれかのタスクを実行できます:

その他のリソース

親トピック: モデルの作成、デプロイ、および信頼についての入門