0 / 0
資料の 英語版 に戻る
クイック・スタート: watsonx.ai エンドツーエンド・ユース・ケースを試す

クイック・スタート: watsonx.ai エンドツーエンド・ユース・ケースを試す

このチュートリアルでは、財務業界のサンプル・ユース・ケースに焦点を当てています。 ゴールデン・バンクは、生産性を向上させ、投資銀行業務における株式アナリストの作業の精度を高めるために、株式の異常分析を実行する必要があります。

必須のサービス
watsonx.ai
Watson Machine Learning

シナリオ: 在庫の異常分析プロセス

この目標を達成するために、標準的なプロセスは以下のようになります。

  1. ある投資銀行家またはマネージャーは、株式アナリストに企業の株式を調査するよう依頼します。
  2. 株式アナリストは、会社の株式データをダウンロードします。
  3. 在庫データを手動で検索して、株価がどのように実行されたかについての異常を検出します。
  4. 特定の日付に関連するニュース記事を Web で手動で検索することで、異常を説明します。
  5. 株式アナリストは、ニュース記事を使用して、異常の背後にある理由を要約します。
  6. 具体的な情報と日付についての調査をフォローしています。
  7. 彼らは投資銀行に報告書を送り、投資に関する意思決定を行うためにさらに分析を行います。

watsonx.ai を使用した基本的なタスク・ワークフロー

Watsonx.ai は、このプロセスの各フェーズの実行に役立ちます。 基本的なワークフローには、以下のタスクが含まれます:

  1. プロジェクトを開きます。 プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
  2. データをプロジェクトに追加します。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
  3. モデルをトレーニングします。 次のようなさまざまなツールを使用できます。AutoAI, SPSS Modeler、または Jupyter ノートブックを使用してモデルをトレーニングします。
  4. モデルをデプロイしてテストします。
  5. データを変換します。
  6. ファウンデーション・モデルを作成します。
  7. ファウンデーション・モデルを調整します。

watsonx.ai について読む

AI 主導のソリューションを使用してビジネス・プロセスを変革するには、企業は機械学習と生成 AI の両方を運用フレームワークに統合する必要があります。 Watsonx.ai は、企業が機械学習モデルと生成 AI ソリューションを開発およびデプロイできるようにするためのプロセスとテクノロジーを提供します。

watsonx.aiについて詳しくは、こちらを参照してください。

watsonx.ai のユース・ケースの詳細を読む

watsonx.ai に関するビデオを見る

< このチュートリアルのステップをプレビューするには、このビデオをご覧ください。 ビデオに表示されるユーザー・インターフェースには若干の違いがある可能性があります。 このビデオは、作成されたチュートリアルのコンパニオンとなることを目的としています。

このビデオは、この資料の概念とタスクを学習するための視覚的な方法を提供します。


watsonx.ai のチュートリアルを試す

このチュートリアルでは、以下のタスクを実行します:





このチュートリアルを完了するためのヒント
このチュートリアルを正常に完了するためのヒントを以下に示します。

ビデオ・ピクチャー・イン・ピクチャーの使用

ヒント: ビデオを開始します。チュートリアルをスクロールすると、ビデオはピクチャー・イン・ピクチャー・モードに移動します。 ピクチャー・イン・ピクチャーを最適に使用するために、ビデオの目次を閉じます。 ピクチャー・イン・ピクチャー・モードを使用すると、このチュートリアルのタスクを実行する際にビデオに従うことができます。 追跡する各タスクのタイム・スタンプをクリックします。

以下のアニメーション・イメージは、ビデオ・ピクチャー・イン・ピクチャーおよび目次機能の使用方法を示しています。

ピクチャー・イン・ピクチャーおよび章の使用方法

コミュニティーでのヘルプの利用

このチュートリアルでヘルプが必要な場合は、 watsonx コミュニティー・ディスカッション・フォーラムで質問したり、回答を見つけたりすることができます。

ブラウザー・ウィンドウのセットアップ

このチュートリアルを最適に実行するには、1 つのブラウザー・ウィンドウで Cloud Pak for Data を開き、このチュートリアル・ページを別のブラウザー・ウィンドウで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。 2 つのブラウザー・ウィンドウを横並びに配置して、見やすくすることを検討してください。

横並びのチュートリアルと UI

ヒント: ユーザー・インターフェースでこのチュートリアルを実行しているときにガイド・ツアーが表示された場合は、 「後で実行することもあります」をクリックします。



タスク 1: サンプル・プロジェクトの作成

チュートリアル・ビデオのプレビュー このタスクをプレビューするには、 00:58から始まるビデオをご覧ください。

このチュートリアルでは、分析を実行するためのデータ・セット、ノートブック、およびプロンプト・テンプレートを含むサンプル・プロジェクトを使用します。 サンプルに基づいてプロジェクトを作成するには、以下の手順を実行します。

  1. リソース・ハブの 「Stock anomalies analysis」 プロジェクトにアクセスします。

    1. 「プロジェクトの作成」をクリックします。

    2. プロジェクト名のデフォルト値を受け入れて、 「作成」をクリックします。

    3. プロジェクトが正常に作成されたら、 「新規プロジェクトの表示」 をクリックします。

  2. Watson Machine Learning サービスをプロジェクトに関連付けます。

    1. プロジェクトが開いたら、 「管理」 タブをクリックし、 「サービスと統合」 ページを選択します。

    2. IBM サービス」 タブで、 「関連付け」をクリックします。

    3. Watson Machine Learning インスタンスを選択します。 Watson Machine Learning サービス・インスタンスがまだプロビジョンされていない場合は、以下の手順を実行します。

      1. 「新規サービス」をクリックします。

      2. Watson Machine Learningを選択します。

      3. 「作成」 をクリックします。

      4. リストから新規サービス・インスタンスを選択します。

    4. 「サービスの関連付け」をクリックします。

    5. 必要に応じて、 「キャンセル」 をクリックして 「サービス」&「統合」 ページに戻ります。

  3. プロジェクトの 「アセット」 タブをクリックして、サンプル・アセットを表示します。

詳しくは、またはビデオを視聴するには、 プロジェクトの作成を参照してください。

関連付けられたサービスについて詳しくは、 関連付けられたサービスの追加を参照してください。

チェックポイント・アイコン 進行状況を確認してください

以下のイメージは、プロジェクトの「資産」タブを示しています。 これで、トレーニング・データを視覚化する準備ができました。

代替テキスト




タスク 2: データの視覚化

チュートリアル・ビデオのプレビュー このタスクをプレビューするには、 01:27から始まるビデオをご覧ください。

サンプル・プロジェクト内の 3 つのデータ・セットには、 Yahoo! のパブリック・ストック・データを使用して生成された合成データが含まれています。 基盤として Web サイトをファイナンシングします。 時系列異常予測モデルのトレーニング・データは、構造化された順次データでなければなりません。 この場合、合成データは構造化され、順次データです。 サンプル・プロジェクト内のデータ資産を表示するには、以下の手順を実行します。

  1. historical_data.csv データ・セットを開きます。 このデータ・セットには、2012 年 5 月から 2016 年 5 月までの株価パフォーマンスの履歴が含まれています。
  2. プロジェクトの 「資産」 タブに戻り、 test_data.csv データ・セットを開きます。 このデータ・セットには、 Q1 2023 の株価パフォーマンスの履歴が含まれています。
  3. プロジェクトの 「資産」 タブに戻り、 training_data.csv データ・セットを開きます。 このデータ・セットには、2023 年の株価パフォーマンスの履歴が含まれています。
  4. 「視覚化」 タブをクリックします。
    1. 「日付」 列を選択し、 「データの視覚化」をクリックします。 最初に提案されたグラフ・タイプ (ヒストグラム) が表示されます。
    2. 「折れ線」 グラフ・タイプを選択します。
      1. 「X 軸」で、 「日付」 列を選択します。
      2. 「Y 軸」で、 「Adj Close」 列を選択します。 日付別の調整済み終値が表示されます。 異常分析のターゲット列は、調整された終値です。

チェックポイント・アイコン 進行状況を確認してください

以下の画像は、 training_data.csv ファイルの視覚化を示しています。 これで、このトレーニング・データを使用してモデルを作成する準備ができました。

training_data.csv ファイルの視覚化




タスク 3: モデルのトレーニング

チュートリアル・ビデオのプレビュー このタスクをプレビューするには、 02:13から始まるビデオをご覧ください。

次のようなさまざまなツールを使用できます。AutoAI, SPSS Modeler、または Jupyter ノートブックを使用してモデルをトレーニングします。 このチュートリアルでは、 AutoAIを使用して時系列分析の異常予測モデルをトレーニングします。 AutoAI エクスペリメントを作成するには、以下の手順を実行します。

  1. プロジェクトの 「資産」 タブに戻り、 「新規資産」>「機械学習モデルの自動ビルド」をクリックします。

  2. 「機械学習モデルの自動ビルド (Build machine learning models automatically)」 ページで、名前を入力します。

    Stock anomaly experiment
    
  3. 「作成」 をクリックします。

  4. 「データ・ソースの追加」 ページで、トレーニング・データを追加します。

    1. プロジェクトからデータを選択をクリックしてください。

    2. 「データ資産」> training_data.csvを選択し、 「資産の選択」をクリックします。

  5. 以下のように、時系列分析の設定を行います。

    1. 時系列エクスペリメントの作成を求められた場合は、 「はい」 を選択します。

    2. 「異常予測」を選択します。

  6. 「フィーチャー列」「Adj Close」 を選択します。

  7. 「エクスペリメントの実行 (Run experiment)」をクリックします。 モデルのトレーニング中に、パイプラインの作成プロセスを示すインフォグラフィックが表示されます。
    モデル・パイプラインの作成

    AutoAI の各機械学習手法で使用可能なアルゴリズム または推定法のリストについては、 AutoAI 実装の詳細を参照してください。

  8. エクスペリメントの実行が完了したら、ランク付けされたパイプラインをリーダーシップ・ボードで表示して比較することができます。

    パイプラインのリーダーボード

  9. 「パイプラインの比較」 をクリックすると、それらの違いを確認できます。

    パイプライン比較メトリック・グラフ

  10. 最もランクが高いパイプラインをクリックすると、パイプラインの詳細が表示されます。

  11. 「モデル評価」 ページを参照して、モデル・パフォーマンスに関する詳細な評価メトリックを確認します。

    AutoAI ツールは、異常を発見するために幅広い基準を考慮します。 この表では、異常タイプごとに、 「平均精度」「ROC 曲線下面積」などのさまざまなメトリックに基づく評価を確認できます。

    異常タイプ
    異常タイプ 説明
    トレンドの異常 時系列のセグメント。これには、セグメントの前の時系列と比較したトレンドの変化があります。
    分散の異常 時系列の分散が変更される、時系列のセグメント。
    局所的な極端な異常 時系列内の異常なデータ・ポイント。周囲のデータ・ポイントから有意に逸脱しています。
    レベル・シフト異常 時系列の平均値が変更されるセグメントです。
  12. モデルを保存します。

    1. 「名前を付けて保存」をクリックします。

    2. 「モデル」を選択します。

    3. モデル名として、次のように入力します。

      Anomaly Prediction Model
      
    4. 「作成」 をクリックします。 これにより、パイプラインがモデルとしてプロジェクトに保存されます。

  13. モデルが保存されたら、通知内の プロジェクトで表示 リンクをクリックして、プロジェクト内のモデルを表示します。 あるいは、プロジェクトの 「資産」 タブにナビゲートし、 「モデル」 セクションでモデル名をクリックすることもできます。

チェックポイント・アイコン 進行状況を確認してください

次の図は、モデルを示しています。

次の図は、モデルを示しています。




タスク 4: モデルのデプロイ

チュートリアル・ビデオのプレビュー このタスクをプレビューするには、 03:40から始まるビデオをご覧ください。

次のタスクは、テスト・データとモデルをデプロイメント・スペースにプロモートしてから、オンライン・デプロイメントを作成することです。

タスク 4a: テスト・データをデプロイメント・スペースにプロモートします。

サンプル・プロジェクトにはテスト・データが含まれています。 そのテスト・データをデプロイメント・スペースにプロモートして、そのテスト・データを使用してデプロイ済みモデルをテストできるようにします。 テスト・データをデプロイメント・スペースにプロモートするには、以下の手順を実行します。

  1. プロジェクトの 資産 タブに戻ります。

  2. test_data.csv データ資産の 「オーバーフロー」 メニュー オーバーフロー・メニュー をクリックし、 「スペースにプロモート」を選択します。

  3. 既存のデプロイメント・スペースを選択してください。 デプロイメント・スペースがない場合は、以下のようにします。

    1. 「新規デプロイメント・スペースの作成」をクリックします。

    2. 名前として、次のように入力します。

      Anomaly Prediction Space
      
    3. ストレージ・サービスを選択してください。

    4. 機械学習サービスを選択してください。

    5. 「作成」 をクリックします。

    6. スペースの準備ができたら通知を閉じます。

  4. リストから新規デプロイメント・スペースを選択します。

  5. プロモートをクリックします。

チェックポイント・アイコン 進行状況を確認してください

次の画像は、 「スペースへのプロモート」 ページを示しています。

以下の画像は、「スペースへのプロモート」ページを示しています。

タスク 4b: デプロイメント・スペースへのモデルのプロモート

モデルをデプロイする前に、モデルをデプロイメント・スペースにプロモートする必要があります。 モデルをデプロイメント・スペースにプロモートするには、以下の手順を実行します。

  1. 「資産」 タブで、 「異常予測モデル」 モデルの 「オーバーフロー」 メニュー オーバーフロー・メニュー をクリックし、 「スペースにプロモート」を選択します。

  2. リストから同じデプロイメント・スペースを選択します。

  3. 「プロモート後にスペース内のモデルに移動」 オプションを選択します。

  4. プロモートをクリックします。

注: プロモート後にスペース内のモデルに移動するオプションを選択しなかった場合は、ナビゲーション・メニューを使用して 「デプロイメント」 にナビゲートし、デプロイメント・スペースとモデルを選択できます。

チェックポイント・アイコン 進行状況を確認してください

以下の図は、デプロイメント・スペース内のモデルを示しています。

以下の図は、デプロイメント・スペース内のモデルを示しています。

タスク 4c: モデル・デプロイメントの作成およびテスト

モデルがデプロイメント・スペースに配置されたので、以下の手順に従ってモデル・デプロイメントを作成します。

  1. モデルを開いた状態で、 「新規デプロイメント」をクリックします。

    1. デプロイメント・タイプとして オンライン を選択してください。

    2. デプロイメント名として、次のように入力します。

      Anomaly Prediction Model Deployment
      
    3. 「作成」 をクリックします。

  2. デプロイメントが完了したら、デプロイメント名をクリックして、デプロイメントの詳細ページを表示します。

  3. スコアリング・エンドポイントを確認します。このエンドポイントは、アプリケーションでこのモデルにプログラマチックにアクセスするために使用できます。

  4. モデルをテストします。

    1. 「テスト」 タブをクリックします。

    2. テスト・データを検索するには、 「スペース内の検索」をクリックします。

    3. 「データ資産」> test_data.csvを選択します。

    4. 「確認 (Confirm)」をクリックします。

    5. 「予測」をクリックし、テスト・データ内の 62 個のレコードの予測を確認します。

チェックポイント・アイコン 進行状況を確認してください

次の図は、デプロイされたモデルからのテスト結果を示しています。

以下の図は、デプロイされたモデルからのテスト結果を示しています。




タスク 5: 関連するニュース記事の収集

チュートリアル・ビデオのプレビュー このタスクをプレビューするには、 05:07から始まるビデオをご覧ください。

プロンプト・ラボは構造化テキストと非構造化テキストを処理できますが、モデルが処理できる適切なデータを確実に入力することが重要です。 このユース・ケースでは、異常予測から取得した異常日に基づいてニュース記事テキストを処理する必要があります。 データ収集プロセスを簡素化するために、外部ニュース API を統合して、それらの日付の間に関連するニュースを抽出することができます。 これは、Jupyter ノートブックで Python コードを使用して行うことができます。

ファウンデーション・モデルには、単一のプロンプト (コンテキスト・ウィンドウと呼ばれる) で処理できるトークンの数に制限があるため、この制限内に収まるようにデータをチャンク化または要約する必要がある場合があります。 このステップにより、入力データは、基盤モデルが重要な情報を失うことなく効果的に処理できる形式になります。

ノートブックを実行するには、以下の手順を実行します。

  1. ナビゲーション・メニュー ナビゲーション・メニューから、 「プロジェクト」>「すべてのプロジェクトを表示」を選択します。
  2. 「Stock anomalies analysis」 プロジェクトを開きます。
  3. 「資産」タブをクリックします。
  4. 「ニュース記事からのテキストの抽出」 ノートブックの 「オーバーフロー」 メニュー オーバーフロー・メニュー をクリックし、 「編集」を選択します。
  5. 「セットアップ」 セクションに入力します。
    1. 最初のセルの 「実行」 アイコン 実行 をクリックして、ライブラリーをインポートします。
    2. 必要な API キーを取得します。
      1. リンクに従ってアカウントとAPIキーを作成してくださいTheNewsAPI
      2. API キーを thenewsapi_key 変数に貼り付けます。
      3. ArticlExtractorのリンクに従って、アカウントと API キーを作成します。
      4. API キーを extract_key 変数に貼り付けます。
    3. セルを実行して、2 つの API キー変数を設定します。
  6. 「ニュース記事の URL を取得する関数の定義」 セクションのセルを実行します。
    • 最初のセルはデータを取得する関数を定義しますTheNewsAPI'sトップストーリーとパラメータを設定して、関連ニュースを確実に取得できるようにします。
    • 2 番目のセルは、応答に基づいて URL のリストのみを取得する関数を定義します。
  7. 「ニュース・テキストを抽出する関数の定義」 セクションのセルを実行します。
    • 最初のセルは、 ArticlExtractor API を使用して特定のニュース URL からニュース・テキストを抽出する関数を定義します。
    • 2番目のセルは、取得したすべての記事URLのニューステキストを結合する関数を定義します。TheNewsAPI 。
  8. 「ニュース・テキストをチャンク化する関数の定義」 セクションのセルを実行します。 LLM ファウンデーション・モデルがテキストから情報を取得できるようにするには、トークンがコンテキスト・トークン・ウィンドウの制限を超えないようにする必要があります。 この例では、 LangChain を使用して、ニュース・テキストのコンテキストを考慮して文字テキストを分割する関数を定義します。
  9. 「関数の実行」 セクションのセルを実行します。 応答では、データの最終出力をプロンプト・ラボに送る準備ができていることを確認できます。 LangChain’sテキスト スプリッターは、長いテキストを意味的に意味のあるチャンクまたは文に分割し、それらを処理されるテキスト全体として再度結合します。 チャンクの最大サイズを調整することができます。

チェックポイント・アイコン 進行状況を確認してください

以下のイメージは、完成したノートブックを示しています。 これで、ファウンデーション・モデルのプロンプトを出すために使用するチャンク・テキストが作成されました。

完成したノートブック




タスク 6: ファウンデーション・モデルのプロンプト

チュートリアル・ビデオのプレビュー このタスクをプレビューするには、 07:17から始まるビデオをご覧ください。

これで、関連するニュース記事が適切にチャンク化されたので、プロンプト・ラボで独自のプロンプト・テンプレートを作成することも、サンプル・プロジェクトでサンプル・プロンプト・テンプレートを使用することもできます。 サンプル・プロジェクトには、要約および質問の回答タスク用のサンプル・プロンプト・テンプレートが含まれています。 プロンプト・ラボでファウンデーション・モデルのプロンプトを表示するには、以下の手順を実行します。

要約タスク

  1. プロジェクトの 資産 タブに戻ります。

  2. 「ニュース記事の要約」 プロンプト・テンプレートをクリックします。 これにより、プロンプト・ラボでプロンプト・テンプレートが開きます。

  3. 「編集」 をクリックして、プロンプト・テンプレートを編集モードで開きます。

    要約タスクでは、入力例としてチャンク・ニュース記事テキストを使用し、通常、ストック・アナリストが出力例として異常を説明するために手動で書き込むことに注意します。 これは、株式アナリストが自分で作成する可能性のあるものと出力が類似していることを確認するためです。

  4. 「生成」 をクリックして、要約結果を表示します。

  5. ノートブックのチャンク化されたニュース記事から、さまざまな入出力テキストを試します。

質問回答タスク

  1. 「保存されたプロンプト」 保存されたプロンプト をクリックして、プロジェクトから保存されたプロンプトを表示します。

  2. 保存されたプロンプトのリストから 「質問/回答ニュース記事」 プロンプト・テンプレートをクリックします。

  3. 「編集」 をクリックして、プロンプト・テンプレートを編集モードで開きます。

    質問への回答タスクでは、入力例として質問を使用し、出力例として必要な詳細レベルおよび優先フォーマットでの回答を使用します。

  4. 「生成」 をクリックして、要約結果を表示します。

  5. さまざまな入出力テキストを試してみてください。

モデル・パラメーターの調整

プロンプト・ラボでは、デコード設定を調整して、特定のタスクのモデルの出力を最適化することができます。

  • デコード
    • 欲張り: 常に確率が最も高い単語を選択します
    • サンプリング: 単語選択の可変性のカスタマイズ
  • 反復ペナルティー: 許可される反復の量
  • 停止基準: 生成された場合にテキスト生成を停止させる 1 つ以上のストリング

この柔軟性により、高度なカスタマイズが可能になり、タスクの要件と制約に最適なパラメーターを使用してモデルが動作するようになります。

プロンプト・ラボでは、トークンの制限を設定して、タスクがモデルの運用範囲内に収まるようにすることができます。 この設定は、応答の包括性とモデルの技術的制限とのバランスを取り、タスクの効率的かつ効果的な処理を確保するのに役立ちます。

チェックポイント・アイコン 進行状況を確認してください

以下の画像は、プロンプト・ラボを示しています。

プロンプト・ラボ



次のステップ

プロンプト・ノートブックを試す

プロンプト・ラボから、作業内容をノートブック形式で保存できます。

  1. 保存されたプロンプト・テンプレートをロードします。
  2. 「作業の保存」>「名前を付けて保存」をクリックします。
  3. ノートブックの選択
  4. 名前を入力します。
  5. 「保存」をクリックしてから、プロンプト・ノートブックを探索します。
  6. もう一方のプロンプト・テンプレートに対して上記のステップを繰り返します。

ファウンデーション・モデルの調整

ファウンデーション・モデルを調整して、プロンプト・エンジニアリングと比較してモデルのパフォーマンスを向上させたり、より大きなモデルと同様に動作するより小さなモデルをデプロイすることでコストを削減したりすることができます。 ファウンデーション・モデルのチューニング のチュートリアルを参照してください。

その他のリソース

親トピック: クイック・スタート・チュートリアル

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細