0 / 0
資料の 英語版 に戻る
クイック・スタートwatsonx.ai エンドツーエンドのユースケースを試す

クイック・スタートwatsonx.ai エンドツーエンドのユースケースを試す

このチュートリアルでは、金融業界での使用例を取り上げます。 ゴールデンバンクは、投資銀行業務における株式アナリストの生産性を向上させ、業務の精度を高めるために、株式の異常分析を行う必要がある。

必須のサービス
watsonx.ai
Watson Machine Learning

シナリオ株価異常分析プロセス

この目標を達成するために、典型的なプロセスは以下のようになる:

  1. 投資銀行家や経営者が株式アナリストに企業の株式調査を依頼する。
  2. 証券アナリストは会社の株式データをダウンロードする。
  3. 手作業で株価データを検索し、株価の異常値を見つけるのだ。
  4. 彼らは、特定の日付の周辺に関連するニュース記事を手作業でウェブ検索することによって、この異常事態を説明している。
  5. 株式アナリストは、ニュース記事を使ってアノマリーの理由をまとめる。
  6. 彼らは特定の情報や日付について追跡調査をする。
  7. そして、その報告書を投資銀行家に送り、投資銀行家がさらなる分析を行って投資判断を下すのである。

watsonx.aiを使った基本的なタスクのワークフロー

Watsonx.aiは、このプロセスの各段階を達成するのに役立ちます。 基本的なワークフローには、以下のタスクが含まれます:

  1. プロジェクトを開きます。 プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
  2. データをプロジェクトに追加します。 接続を介してリモート・データ・ソースからの CSV ファイルまたはデータを追加できます。
  3. モデルを訓練する。 AutoAI, SPSS Modeler、またはJupyterノートブックなど、さまざまなツールを使用してモデルをトレーニングすることができます。
  4. モデルをデプロイしてテストします。
  5. データを変換する。
  6. ファンデーションモデルを促す。
  7. 基礎モデルを調整する。

watsonx.aiについて読む

AIを活用したソリューションでビジネスプロセスを変革するには、機械学習とジェネレーティブAIの両方をオペレーションのフレームワークに統合する必要がある。 Watsonx.aiは、企業が機械学習モデルとジェネレーティブ AI ソリューションを開発および展開できるようにするプロセスとテクノロジーを提供します。

watsonx.aiについてもっと知る

watsonx.aiの使用例をもっと読む

watsonx.aiについてのビデオを見る

< このチュートリアルのステップをプレビューするには、このビデオをご覧ください。 ビデオで紹介されているユーザー・インターフェースには若干の違いがあるかもしれません。 このビデオは、書面でのチュートリアルに付随するものです。

このビデオは、このドキュメントのコンセプトとタスクを学ぶための視覚的な方法を提供します。


watsonx.ai へのチュートリアルを試してみてください

このチュートリアルでは、以下のタスクを実行します:





このチュートリアルを完了するためのヒント
このチュートリアルを成功させるためのヒントを紹介します。

ビデオのピクチャー・イン・ピクチャーを使う

ヒント:ビデオを開始し、チュートリアルをスクロールすると、ビデオはピクチャ・イン・ピクチャ・モードに移行します。 ピクチャー・イン・ピクチャーで最高の体験をするために、ビデオの目次を閉じてください。 ピクチャ・イン・ピクチャ・モードを使用すると、このチュートリアルのタスクを完了しながらビデオを追うことができます。 各タスクのタイムスタンプをクリックしてください。

次のアニメーション画像は、ビデオのピクチャー・イン・ピクチャーと目次機能の使い方を示しています:

ピクチャー・イン・ピクチャーとチャプターの使い方

地域の助けを借りる

このチュートリアルで助けが必要な場合は、watsonx コミュニティ ディスカッション フォーラムで質問したり、答えを見つけることができます。

ブラウザのウィンドウを設定する

このチュートリアルを最適に完了するには、Cloud Pak for Data を 1 つのブラウザ ウィンドウで開き、このチュートリアルのページを別のブラウザ ウィンドウで開いておくと、2 つのアプリケーションを簡単に切り替えることができます。 2つのブラウザウィンドウを横に並べると、より見やすくなります。

サイド・バイ・サイドのチュートリアルとUI

ヒント: このチュートリアルを完了する際に、ユーザーインターフェイスでガイドツアーが表示された場合は、後でをクリックしてください。



タスク 1:サンプルプロジェクトの作成

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、00:58から始まるビデオを見てください。

このチュートリアルでは、分析を実行するためのデータセット、ノートブック、プロンプト・テンプレートが含まれたサンプル・プロジェクトを使用します。 以下の手順に従って、サンプルに基づいたプロジェクトを作成してください:

  1. リソースハブの株価異常分析プロジェクトにアクセスします。

    1. プロジェクトを作成をクリックします。

    2. プロジェクト名のデフォルト値を受け入れ、Createをクリックします。

    3. プロジェクトが正常に作成されたら、新しいプロジェクトを見るをクリックします。

  2. Watson Machine Learning サービスをプロジェクトに関連付けます:

    1. プロジェクトが開いたら、管理タブをクリックし、サービスと統合ページを選択します。

    2. IBM servicesタブで、Associateをクリックします。

    3. Watson Machine Learning インスタンスを選択します。 Watson Machine Learning サービス・インスタンスがまだプロビジョニングされていない場合は、以下の手順に従ってください:

      1. 新規サービスをクリックします。

      2. Watson Machine Learningを選択します。

      3. 「作成」 をクリックします。

      4. リストから新しいサービス・インスタンスを選択する。

    4. サービスを関連付けるをクリックします。

    5. 必要に応じて、キャンセルをクリックし、サービス & 統合ページに戻ります。

  3. プロジェクトのアセットタブをクリックすると、サンプルアセットが表示されます。

詳細やビデオについては、プロジェクトの作成をご覧ください。

関連サービスの詳細については、関連サービスの追加を参照してください。

チェックポイント・アイコン 進捗状況を確認する

次の図は、プロジェクトの「資産」タブを示しています。 これでトレーニングデータを視覚化する準備が整いました。

代替テキスト




タスク2:データを視覚化する

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、01:27から始まるビデオを見てください。

サンプルプロジェクトの3つのデータセットには、Yahoo! ファイナンスのウェブサイトをベースにしています。 時系列異常予測モデルの学習データは、構造化され、連続的でなければならない。 この場合、合成データは構造化され、シーケンシャルである。 以下の手順で、サンプルプロジェクトのデータ資産を表示します:

  1. historical_data.csv データセットを開く。 このデータセットには、2012年5月から2016年5月までの過去の株価実績が含まれている。
  2. プロジェクトの資産タブに戻り、test_data.csv データセットを開きます。 このデータセットには、Q1における過去の株価実績が含まれている。
  3. プロジェクトの資産タブに戻り、training_data.csv データセットを開きます。 このデータセットには、2023年の過去の株価実績が含まれている。
  4. ビジュアライゼーションタブをクリックします。
    1. 日付列を選択し、データの可視化をクリックします。 最初に提案されたチャート・タイプであるヒストグラムが表示される。
    2. Line チャート・タイプを選択します。
      1. X軸では、日付列を選択する。
      2. Y軸で、Adj終値列を選択する。 これは、日付ごとの調整された終値を示している。 アノマリー分析の対象列は、調整後の終値である。

チェックポイント・アイコン 進捗状況を確認する

次の画像は、training_data.csv ファイルを視覚化したものです。

これで、このトレーニングデータを使ってモデルを構築する準備ができた

training_data.csvファイルの可視化




タスク3:モデルのトレーニング

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、02:13から始まるビデオを見てください。

AutoAI, SPSS Modeler、またはJupyterノートブックなど、さまざまなツールを使用してモデルをトレーニングすることができます。 このチュートリアルでは、AutoAIを使って時系列分析の異常予測モデルを学習します。 以下の手順に従って、AutoAI実験を作成する:

  1. プロジェクトのアセットタブに戻り、新規アセット >機械学習モデルを自動的に構築をクリックします。

  2. 機械学習モデルを自動的に構築するページで、名前を入力する:

    Stock anomaly experiment
    
  3. 「作成」 をクリックします。

  4. データソースの追加ページで、トレーニングデータを追加します:

    1. プロジェクトからデータを選択をクリックしてください。

    2. データ資産 > training_data.csvを選択し、資産の選択をクリックします。

  5. 時系列分析の設定を行う:

    1. 時系列実験の作成を求められたらはいを選択する。

    2. 異常予測を選択します。

  6. Feature columnAdj Closeを選択する。

  7. 「エクスペリメントの実行 (Run experiment)」をクリックします。 モデルのトレーニングが進むにつれて、パイプラインの構築過程を示すインフォグラフィックが表示される。
    モデルパイプラインの構築

    AutoAI の各機械学習手法で使用可能なアルゴリズム または推定法のリストについては、 AutoAI 実装の詳細を参照してください。

  8. 実験が完了すると、ランキングされたパイプラインをリーダーボードで表示し、比較することができます。

    パイプラインのリーダーボード

  9. パイプラインの比較をクリックすると、両者の違いを見ることができる。

    パイプライン比較指標表

  10. 最高ランクのパイプラインをクリックすると、パイプラインの詳細が表示されます。

  11. モデルの評価ページで、モデルのパフォーマンスに関する詳細な評価指標を確認してください。

    AutoAIツールは、幅広い基準を考慮して異常を発見する。 表では、平均精度ROC下面積など、異常の種類ごとに異なる指標に基づく評価を見ることができます。

    異常タイプ
    異常タイプ 説明
    トレンド・アノマリー 時系列のセグメントで、そのセグメントの前の時系列と比較してトレンドが変化しているもの。
    バリアンス・アノマリー 時系列の分散が変化する時系列のセグメント。
    局地的な極端な異常 時系列における異常なデータポイントで、その周辺のデータポイントから大きく乖離している。
    レベルシフト・アノマリー 時系列の平均値が変化する区間。
  12. モデルを保存します。

    1. 名前を付けて保存をクリックします。

    2. モデルを選択します。

    3. モデル名には

      Anomaly Prediction Model
      
    4. 「作成」 をクリックします。 これにより、パイプラインがモデルとしてプロジェクトに保存されます。

  13. モデルが保存されたら、通知内の プロジェクトで表示 リンクをクリックして、プロジェクト内のモデルを表示します。 あるいは、プロジェクトの資産タブに移動し、モデルセクションでモデル名をクリックすることもできます。

チェックポイント・アイコン 進捗状況を確認する



以下の画像はモデルを示している

以下の画像はそのモデルである。




タスク4:モデルのデプロイ

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、03:40から始まるビデオを見てください。

次のタスクは、テストデータとモデルをデプロイメントスペースに昇格させ、オンラインデプロイメントを作成することである。

タスク 4a: テストデータをデプロイ空間にプロモートする

サンプルプロジェクトにはテストデータが含まれています。 そのテストデータをデプロイメントスペースに昇格させ、デプロイされたモデルをテストするためにテストデータを使用できるようにします。 テスト データを配置スペースに昇格させるには、次の手順に従います:

  1. プロジェクトの 資産 タブに戻ります。

  2. test_data.csv データ資産のオーバーフローメニューオーバーフロー・メニューをクリックし、スペースに昇格を選択します。

  3. 既存のデプロイメント・スペースを選択してください。 もし配置スペースがなければ:

    1. 新しい配置スペースを作成をクリックします。

    2. 名前にはこう入力する:

      Anomaly Prediction Space
      
    3. ストレージ・サービスを選択してください。

    4. 機械学習サービスを選択してください。

    5. 「作成」 をクリックします。

    6. スペースの準備ができたら通知を閉じる。

  4. リストから新しい配置スペースを選択します。

  5. プロモートをクリックします。

チェックポイント・アイコン 進捗状況を確認する

次の図は、スペースに昇格 page.

を示している

次の画像は「宇宙へのプロモート」ページです。

タスク 4b: 展開スペースにモデルをプロモートする

モデルを配置する前に、モデルを配置スペースにプロモートする必要があります。 以下の手順に従って、モデルを配置スペースにプロモートしてください:

  1. 資産タブで、異常予測モデルモデルのオーバーフローメニューオーバーフロー・メニューをクリックし、宇宙に昇格を選択します。

  2. リストから同じ配置スペースを選択します。

  3. プロモーション後、スペース内のモデルに移動するオプションを選択します。

  4. プロモートをクリックします。

注意:プロモーション後にスペース内のモデルに移動するオプションを選択しなかった場合は、ナビゲーション メニューを使用して デプロイメントに移動し、デプロイメント スペースとモデルを選択できます。

チェックポイント・アイコン 進捗状況を確認する



以下の画像は、デプロイメントスペースのモデルを示しています

以下の画像は、展開空間内のモデルを示している。

タスク 4c: モデルのデプロイメントを作成し、テストする

モデルが配置スペースに配置されたので、以下の手順に従ってモデルの配置を作成します:

  1. モデルを開いた状態で、新規配置をクリックします。

    1. デプロイメント・タイプとして オンライン を選択してください。

    2. 配備名には、次のように入力する:

      Anomaly Prediction Model Deployment
      
    3. 「作成」 をクリックします。

  2. デプロイメントが完了したら、デプロイメント名をクリックして、デプロイメントの詳細ページを表示します。

  3. あなたのアプリケーションでこのモデルにプログラム的にアクセスするために使用できる、スコアリング・エンドポイントを確認してください。

  4. モデルをテストします。

    1. テストタブをクリックします。

    2. テストデータを探すには、スペースで検索をクリックします。

    3. Data asset > test_data.csv を選択します。

    4. 「確認 (Confirm)」をクリックします。

    5. 予測をクリックし、テストデータの62レコードの予測を確認します。

チェックポイント・アイコン 進捗状況を確認する



以下の画像は、デプロイされたモデルのテスト結果です

以下の画像は、デプロイされたモデルのテスト結果である。




タスク5:関連するニュース記事を集める

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、05:07から始まるビデオを見てください。

プロンプト・ラボは構造化テキストと非構造化テキストを扱うことができますが、モデルが処理できる正しいデータを入力することが不可欠です。 このユースケースでは、異常予測から得た異常日時に基づいてニュース記事のテキストを処理する必要がある。 外部のニュースAPIを統合して、その日付に関連するニュースを抽出し、データ収集プロセスを簡素化することができる。 これはJupyterノートブックでPythonコードを使って行うことができます。

基礎モデルには、1回のプロンプトで処理できるトークンの数に制限があるため(コンテキストウィンドウとして知られている)、この制限内に収まるようにデータをチャンク化または要約する必要があるかもしれない。 このステップでは、入力データが重要な情報を失うことなく、基礎モデルが効果的に処理できる形式であることを確認する。

ノートブックを実行するには、以下の手順に従ってください:

  1. ナビゲーションメニュー ナビゲーション・メニューから、プロジェクト > すべてのプロジェクトを表示を選択します。
  2. 株価異常分析プロジェクトを開く。
  3. 「資産」タブをクリックします。
  4. オーバーフローメニューのオーバーフロー・メニューをクリックし、ニュース記事からテキストを抽出するノートブックの編集を選択します。
  5. セットアップセクションを完了します。
    1. 最初のセルの実行アイコン実行をクリックして、ライブラリをインポートします。
    2. 必要なAPIキーを取得する:
      1. TheNewsAPIのリンクからアカウントとAPIキーを作成してください。
      2. API キーを thenewsapi_key 変数に貼り付けます。
      3. ArticlExtractor でアカウントとAPIキーを作成するリンクに従ってください。
      4. API キーを extract_key 変数に貼り付けます。
    3. セルを実行して2つのAPIキー変数を設定する。
  6. ニュース記事のURLを取得する関数を定義するセクションでセルを実行する。
    • 最初のセルでは、TheNewsAPI's Top Storiesからデータを取得する関数を定義し、関連するニュースを取得できるようにパラメータを設定しています。
    • 番目のセルは、レスポンスに基づいてURLのリストだけを取得する関数を定義している。
  7. ニューステキストを抽出する関数を定義するセクションでセルを実行する。
    • 最初のセルでは、ArticlExtractor APIを使って、特定のニュースURLからニューステキストを抽出する関数を定義しています。
    • 2番目のセルは、TheNewsAPIから取得したすべての記事URLからニューステキストを結合する関数を定義している。
  8. ニューステキストをチャンクする関数を定義するセクションでセルを実行する。 LLM基礎モデルがテキストからの情報を確実に取り込めるようにするには、トークンがコンテクストトークンウィンドウの制限を超えないようにする必要があります。 この例では、LangChainを使って、ニューステキストの文脈を考慮して文字テキストを分割する関数を定義しています。
  9. 関数を実行セクションでセルを実行する。 レスポンスでは、データの最終出力がプロンプト・ラボに入力できる状態になっていることがわかる。 LangChain’sテキストスプリッタは、長いテキストを意味的に意味のある塊(センテンス)に分割し、それらを再び全体のテキストとして結合して処理します。 チャンクの最大サイズを調整できる。

チェックポイント・アイコン 進捗状況を確認する

次の画像は完成したノートブックです。 これで、基礎モデルのプロンプトに使用するチャンク・テキストができた。

完成したノート




タスク6:基礎モデルのプロンプト

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、07:17から始まるビデオを見てください。

関連するニュース記事が適切にチャンクされたので、プロンプトラボで独自のプロンプトテンプレートを作成することもできますし、サンプルプロジェクトのサンプルプロンプトテンプレートを使用することもできます。 このサンプルプロジェクトには、要約や質問に答えるタスクのためのサンプルプロンプトテンプレートが含まれています。 以下の手順に従って、プロンプトラボでファウンデーションモデルをプロンプトしてください。

要約タスク

  1. プロジェクトの 資産 タブに戻ります。

  2. ニュース記事の要約プロンプトテンプレートをクリックします。 これにより、プロンプトテンプレートがプロンプトラボで開きます。

  3. Editをクリックすると、プロンプトテンプレートが編集モードで開きます。

    要約タスクでは、チャンク化されたニュース記事テキストを入力例として使用し、通常、株式アナリストが異常事態を説明するために手作業で書くメモを出力例として使用する。 これは、証券アナリストが自分で書いたものと同じようなものが出力されるようにするためである。

  4. Generateをクリックすると、要約結果が表示されます。

  5. ノートブックのチャンクされたニュース記事から、さまざまな入力と出力のテキストを試す。

質問回答タスク

  1. 保存されたプロンプト 保存されたプロンプトをクリックすると、プロジェクトの保存されたプロンプトが表示されます。

  2. 保存されているプロンプトの一覧から、質問応答ニュース記事プロンプトテンプレートをクリックします。

  3. Editをクリックすると、プロンプトテンプレートが編集モードで開きます。

    質問と回答のタスクでは、入力例として質問を使い、出力例として要求される詳細レベルと望ましい形式の回答を使います。

  4. Generateをクリックすると、要約結果が表示されます。

  5. 入力と出力のテキストを変えて実験する。

モデルのパラメーターを調整する

プロンプト・ラボでは、デコード設定を調整して、モデルの出力を特定のタスクに最適化することができます:

  • デコード
    • 貪欲:常に最も確率の高い単語を選択する
    • サンプリング:単語選択のばらつきをカスタマイズする
  • 反復ペナルティ:どの程度の反復が許されるか
  • 停止基準:生成された場合にテキスト生成を停止させる1つ以上の文字列

この柔軟性により、高度なカスタマイズが可能になり、タスクの要件と制約に最適なパラメータでモデルを動作させることができる。

プロンプト・ラボでは、トークンの制限を設定して、タスクがモデルの運用範囲内に収まるようにすることができます。 この設定は、回答の包括性とモデルの技術的限界のバランスをとり、効率的かつ効果的なタスク処理を保証するのに役立つ。

チェックポイント・アイコン 進捗状況を確認する



以下の画像はプロンプト・ラボです

プロンプト・ラボ



次のステップ

プロンプト・ノートを使ってみる

プロンプト・ラボでは、ノートブック形式で作品を保存することができます:

  1. 保存したプロンプトテンプレートをロードする。
  2. Save work > Save asをクリックします。
  3. ノートブックの選択
  4. 名前を入力します。
  5. 保存をクリックし、プロンプトノートブックを検索します。
  6. もう一方のプロンプトテンプレートについても、この手順を繰り返します。

基礎モデルの調整

ファウンデーション・モデルをチューニングして、プロンプト・エンジニアリングだけよりもモデルのパフォーマンスを向上させたり、大きなモデルと同等のパフォーマンスを発揮する小さなモデルを配備してコストを削減したりしたいかもしれない。 基礎モデルを調整するチュートリアルを参照してください。

その他のリソース

親トピック: クイック・スタート・チュートリアル

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細