クイック・スタート: Jupyter ノートブックでの機械学習モデルの作成とデプロイする
Jupyter ノートブックで Watson Machine Learning を使用して、機械学習モデルを作成、トレーニング、およびデプロイできます。 Jupyter ノートブックについて読み、ビデオを見て、中間ユーザーに適したコーディングが必要なチュートリアルを受けます。
- 必須のサービス
- Watson Studio
- Watson Machine Learning
基本的なワークフローには、以下のタスクが含まれます:
- サンドボックス・プロジェクトを開きます。 プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
- ノートブックをプロジェクトに追加します。 ブランクのノートブックを作成することも、ファイルまたは GitHub リポジトリーからノートブックをインポートすることもできます。
- コードを追加し、ノートブックを実行します。
- モデル・パイプラインを確認し、目的のパイプラインをモデルとして保存します。
- モデルをデプロイしてテストします。
Jupyter ノートブックについて読む
Jupyter ノートブックは、対話式計算処理のための Web ベースの環境です。 ノートブックで機械学習モデルを構築することを選択した場合、Jupyter ノートブックでのコーディングに慣れておく必要があります。 データを処理する小さなコード断片を実行して、計算結果を即時に表示することができます。 このツールを使用して、データを処理するために必要なすべてのビルディング・ブロックをアセンブル、テスト、および実行し、データを Watson Machine Learningに保存し、モデルをデプロイすることができます。
Jupyter ノートブックでのモデルの作成に関するビデオを見る
このビデオを見て、Jupyter ノートブックで機械学習モデルをトレーニング、デプロイ、およびテストする方法を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
Jupyter ノートブックでモデルを作成するためのチュートリアルを試す
このチュートリアルでは、以下のタスクを実行します:
-
- モデルを作成してトレーニングします。
- パイプラインをモデルとして保存します。
- モデルをデプロイします。
- デプロイされたモデルをテストします。
このチュートリアルを完了するための所要時間は約 30 分です。
サンプルデータ
このチュートリアルで使用するサンプル・データは、 scikit-learn の一部であるデータからのものであり、0 から 9 までの手書きの数字の画像を認識するようにモデルをトレーニングするために使用されます。
このチュートリアルを完了するためのヒント
このチュートリアルを正常に完了するためのヒントを以下に示します。
ビデオ・ピクチャー・イン・ピクチャーの使用
以下のアニメーション・イメージは、ビデオ・ピクチャー・イン・ピクチャーおよび目次機能の使用方法を示しています。
コミュニティーでのヘルプの利用
このチュートリアルでヘルプが必要な場合は、 watsonx コミュニティー・ディスカッション・フォーラムで質問したり、回答を見つけたりすることができます。
ブラウザー・ウィンドウのセットアップ
このチュートリアルを最適に実行するには、1 つのブラウザー・ウィンドウで Cloud Pak for Data を開き、このチュートリアル・ページを別のブラウザー・ウィンドウで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。 2 つのブラウザー・ウィンドウを横並びに配置して、見やすくすることを検討してください。
タスク 1: プロジェクトを開く
データおよび AutoAI エクスペリメントを保管するためのプロジェクトが必要です。 サンドボックス・プロジェクトを使用することも、プロジェクトを作成することもできます。
ナビゲーション・メニュー から、 「プロジェクト」>「すべてのプロジェクトを表示」 を選択します。
サンドボックス・プロジェクトを開きます。 新規プロジェクトを使用する場合は、以下のようにします。
新規プロジェクトをクリックしてください。
「空のプロジェクトの作成」を選択します。
プロジェクトの名前と説明 (オプション) を入力します。
既存の オブジェクト・ストレージ・サービス・インスタンス を選択するか、または新規作成します。
「作成」 をクリックします。
プロジェクトが開始したら、 管理 タブをクリックし、 サービスと統合 ページを選択してください。
このタスクをプレビューするには、 00:07から始まるビデオをご覧ください。
IBM サービス」 タブで、 「サービスの関連付け」をクリックします。
Watson Machine Learning インスタンスを選択します。 Watson Machine Learning サービス・インスタンスがまだプロビジョンされていない場合は、以下の手順を実行します。
「新規サービス」をクリックします。
Watson Machine Learningを選択します。
「作成」 をクリックします。
リストから新規サービス・インスタンスを選択します。
「サービスの関連付け」をクリックします。
必要に応じて、 「キャンセル」 をクリックして 「サービス」&「統合」 ページに戻ります。
詳細情報やビデオを見るには、 プロジェクトの作成を参照してください。
関連サービスについて詳しくは、 関連サービスの追加を参照してください。
進行状況を確認してください
以下の画像は、新規プロジェクトを示しています。
タスク 2: プロジェクトへのノートブックの追加
このタスクをプレビューするには、 00:18から始まるビデオをご覧ください。
このチュートリアルでは、サンプル・ノートブックを使用します。 以下のステップに従って、サンプル・ノートブックをプロジェクトに追加します。
リソース・ハブの Use sckit-learn to recognize hand-written digits notebook にアクセスします。
プロジェクトに追加をクリックしてください。
リストからプロジェクトを選択し、 追加をクリックしてください。
ノートブックの名前と説明を確認します (オプション)。
このノートブックのランタイム環境を選択してください。
「作成」 をクリックします。 ノートブック・エディターがロードされるまで待ちます。
メニューから、 「カーネル」>「再始動」&「出力のクリア」をクリックしてから、 「再始動してすべての出力をクリア」 をクリックして確認し、最後に保存した実行の出力をクリアします。
進行状況を確認してください
以下の画像は、新しいノートブックを示しています。
タスク 3: 環境のセットアップ
このタスクをプレビューするには、 00:44から始まるビデオをご覧ください。
ノートブックの最初のセクションでは、 IBM Cloud 資格情報と Watson Machine Learning サービス・インスタンスの場所を指定して環境をセットアップします。 ノートブックで環境をセットアップするには、以下の手順に従います。
環境のセットアップ セクションまでスクロールします。
API キーとロケーションを取得する方法を選択してください。
コマンド・プロンプトからノートブックの IBM Cloud CLI コマンドを実行します。
IBM Cloud コンソールを使用してください。
IBM Cloud コンソールの「API キー」セクション、および API キーの作成を起動します。
IBM Cloud リソース・リストにアクセスし、 Watson Machine Learning サービス・インスタンスを表示して、 ロケーションをメモします。
正しいエンドポイント URL については、 Watson Machine Learning API 資料 を参照してください。 例えば、ダラスは us-south にあります。
API キーと場所をセル 1 に貼り付けます。
「実行」 アイコン をクリックして、セル 1 と 2 でコードを実行します。
セル 3 を実行して、
ibm-watson-machine-learning
パッケージをインストールします。セル 4 を実行して API クライアントをインポートし、資格情報を使用して API クライアント・インスタンスを作成します。
既存のすべてのデプロイメント・スペースのリストを表示するには、コード
client.spaces.list(limit=10)
を使用してセルを実行します。 デプロイメント・スペースがない場合は、以下の手順を実行します。watsonx デプロイメントで別のタブを開きます。
ナビゲーション・メニュー で、 「デプロイメント」をクリックします。
新規デプロイメント・スペースをクリックしてください。
デプロイメントの名前と説明 (オプション) を追加します。
作成をクリックしてから、 新規スペースの表示をクリックしてください。
「管理」 タブをクリックします。
Space GUID をコピーしてタブを閉じると、この値が
space_id
になります。
コード
space_id = 'PASTE YOUR SPACE ID HERE'
を使用して適切なデプロイメント・スペース ID をセルにコピー・アンド・ペーストしてから、そのセルとコードclient.set.default_space(space_id)
を使用してセルを実行し、デフォルト・スペースを設定します。
進行状況を確認してください
以下のイメージは、すべての環境変数がセットアップされたノートブックを示しています。
タスク 4: ノートブックの実行
このタスクをプレビューするには、 02:14から始まるビデオをご覧ください。
これですべての環境変数がセットアップされたので、ノートブックの残りのセルを実行できます。 以下のステップに従って、コメントを読み、セルを実行し、出力を確認します。
「データの探索」 セクションのセルを実行します。
「scikit-learn モデルの作成 (Create a scikit-learn model)」 セクションのセルを実行します。
データを 3 つのデータ・セット (トレーニング、テスト、およびスコア) に分割して準備します。
パイプラインを作成します。
モデルをトレーニングします。
テスト・データを使用してモデルを評価します。
「ローカルに作成された scikit-learn モデルの永続化」 セクションのセルを実行して、モデルを公開し、モデルの詳細を取得し、すべてのモデルを取得します。
注:Python 3.11でランタイム 24.1 を使用している場合は、
software_spec_uid
をruntime-24.1-py3.11
に変更し、scikit-learn バージョンをscikit-learn-1.3
に変更する必要があります。「デプロイとスコア (Deploy and score)」 セクションのセルを実行して、オンライン・デプロイメントを作成し、デプロイメントの詳細を取得し、デプロイされたモデルに評価要求を送信して予測を確認します。
「ファイル」>「保存」をクリックします。
進行状況を確認してください
以下の画像は、予測を含むノートブックを示しています。
タスク 5: デプロイメント・スペース内のデプロイ済みモデルの表示およびテスト
このタスクをプレビューするには、 04:07から始まるビデオをご覧ください。
デプロイメント・スペースからモデル・デプロイメントを直接表示することもできます。 スペースにデプロイされたモデルをテストするには、以下の手順を実行します。
ナビゲーション・メニュー で、 「デプロイメント」をクリックします。
「スペース」 タブをクリックします。
リストから適切なデプロイメント・スペースを選択してください。
「Scikit モデル」をクリックします。
「scikit モデルのデプロイメント」をクリックします。
エンドポイント および コード・スニペットを確認してください。
「テスト」 タブをクリックします。 以下の JSON コードを貼り付けることで、デプロイされたモデルをテストできます:
{"input_data": [{"values": [[0.0, 0.0, 5.0, 16.0, 16.0, 3.0, 0.0, 0.0, 0.0, 0.0, 9.0, 16.0, 7.0, 0.0, 0.0, 0.0, 0.0, 0.0, 12.0, 15.0, 2.0, 0.0, 0.0, 0.0, 0.0, 1.0, 15.0, 16.0, 15.0, 4.0, 0.0, 0.0, 0.0, 0.0, 9.0, 13.0, 16.0, 9.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 14.0, 12.0, 0.0, 0.0, 0.0, 0.0, 5.0, 12.0, 16.0, 8.0, 0.0, 0.0, 0.0, 0.0, 3.0, 15.0, 15.0, 1.0, 0.0, 0.0], [0.0, 0.0, 6.0, 16.0, 12.0, 1.0, 0.0, 0.0, 0.0, 0.0, 5.0, 16.0, 13.0, 10.0, 0.0, 0.0, 0.0, 0.0, 0.0, 5.0, 5.0, 15.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 8.0, 15.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 13.0, 13.0, 0.0, 0.0, 0.0, 0.0, 0.0, 6.0, 16.0, 9.0, 4.0, 1.0, 0.0, 0.0, 3.0, 16.0, 16.0, 16.0, 16.0, 10.0, 0.0, 0.0, 5.0, 16.0, 11.0, 9.0, 6.0, 2.0]]}]}
予測をクリックしてください。 結果の予測は、手書きの数字が 5 と 4 であることを示しています。
進行状況を確認してください
以下の画像は、予測が表示された 「テスト」 タブを示しています。
(オプション) タスク 6: クリーンアップ
ノートブックによって作成されたすべての資産を削除する場合は、 Machine Learning 成果物管理ノートブックに基づいて新規ノートブックを作成します。 このノートブックへのリンクは、このチュートリアルで使用する 「scikit-learn を使用して手書きの数字ノートブックを認識する (Use scikit-learn to recognize hand-written digits notebook)」 の 「クリーンアップ」 セクションにもあります。
次のステップ
これで、このデータ・セットをさらに分析するために使用できます。 例えば、ユーザーまたは他のユーザーは、以下のいずれかのタスクを実行できます:
その他のリソース
モデルを作成するには、以下の他の方法を試してください。
詳しくは、 ビデオを参照してください。
リソース・ハブでサンプル・データ・セット、プロジェクト、モデル、プロンプト、およびノートブックを検索して、実地体験を得ることができます。
データの分析およびモデルの作成を開始するためにプロジェクトに追加できる ノートブック 。
プロジェクト ノートブック、データ・セット、プロンプト、およびその他の資産を含むものをインポートできます。
データ・セット 。これをプロジェクトに追加して、モデルの精製、分析、およびビルドを行うことができます。
プロンプト 。プロンプト・ラボで基盤モデルのプロンプトを出すために使用できます。
プロンプト・ラボで使用できる 基盤モデル 。
詳しくは、 Python クライアントのサンプルと例を参照してください。
親トピック: クイック・スタート・チュートリアル