0 / 0

初期の戦略的決定

最終更新: 2025年5月08日
を作成しました:"2024-08-16 11:03:24 -0700" タイトル :"最初の戦略的決断" fname: " getting-started\plan-initial.liquid.md "

を作成しました:"2024-08-16 11:03:24 -0700" タイトル :"最初の戦略的決断" fname: " getting-started\plan-initial.liquid.md "

ジェネレーティブAIや機械学習ソリューションの計画を始める前に、いくつかの重要な戦略的決定を下さなければならない。 戦略は、組織の要件と優先事項、開発チームのスキルと好み、データ要件、ソリューション要件を考慮しなければならない。

AIソリューション導入の戦略を立てるには、以下のことを決定する:

使用例

ソリューションの目標、その目標が実現可能で価値があるかどうか、そしてソリューションの準備が整う時期をどのように判断するかを理解する:

AIタスク
モデルに何をさせるのか?
実現可能性
AIの限界を理解し、あなたのユースケースが実現可能かどうかを評価できるようにする。
例えば、実装したいユースケースの種類に応じた基盤モデルベンチマークスコアを確認することができる。
例えば、機械学習(ML)モデルを訓練するためには、アルゴリズムが正確な予測や分類を行うのに十分な質の高いラベル付きデータが必要である。
ビジネス価値
そのソリューションのメリットが、そのソリューションの運用コストよりも大きいかどうかを検討する。
成功基準
ソリューションが成功したかどうかを測定する方法を決める。 例えば、評価指標やターゲットユーザーからのユーザーフィードバックに頼ることができる。

AIや機械学習を導入するかどうか

扱うデータの種類と、そのデータで何をしたいかで、機械学習と生成AIのどちらが必要かを決めることができる。

データの型
AIで処理したいデータが構造化されているか非構造化されているかによって、どのタイプのAIが必要かがわかることが多い:
  • 構造化されている:表形式でラベル付けされたデータセットを持っているなら、おそらく機械学習が必要だろう。
  • 非構造化:大量のドキュメントやその他のタイプの非構造化データがある場合、おそらくジェネレーティブAIが必要だろう。
ゴールの種類
数学的アルゴリズムでデータを分析したいのか、新しいコンテンツを生成したいのかで、どのタイプのAIが必要かがわかる:
  • データを分析または分類する:構造化されたデータを分析するために数式や統計式を使用したい場合は、機械学習が必要です。 例えば、機械学習を使えば、予測を立てたり、パターンを検出したり、最適化問題を解決したりすることができる。
  • コンテンツを生成する:非構造化コンテンツを生成したいなら、ジェネレーティブAIが必要だ。 例えば、gen AIを使えば、要約、分類、翻訳、テキストやコードの生成ができる。

MLとジェネAIの違いについての詳細はこちら

誰を巻き込むか

最初から適切な利害関係者を巻き込めば、方向転換が必要になったり、プロセスの一部を繰り返したりするリスクは少なくなる。 少なくとも、これらのチームの利害関係者を計画プロセスに参加させる:

組織の優先順位とプロセスを定義する人々
このような人たちは、あなたが守らなければならない要件や制限について教えてくれる必要がある。 ソリューションに関する特定の情報を文書化したり、規制に準拠するためにワークフローに従ったり、特定のタイプのソースを持つ基盤モデル選択したりする必要があるかもしれない。 たとえば、あなたの組織がオープンソースの基盤モデル選択を要求するかもしれない。
ソリューションを利用する人々
ソリューションの要件を定義し、そのソリューションが彼らのプロセスで機能するかどうかをテストし、検証するためには、このような人々が必要である。
解決策を生み出す人々
このような人々が設計や運営上の決定に関与する必要がある。 この協力者チームには、デザイナー、データエンジニア、AIエンジニア、データサイエンティスト、リスク・コンプライアンス・マネージャーなどが含まれる。
例えば、文書作成に検索拡張生成ソリューションを導入する場合、コンテンツをAIに適合させることができるコンテンツ・ライターを含めることを検討する。
例えば、住宅ローン申請ソリューションを導入する場合、リスクおよびコンプライアンス・マネージャーを必ず参加させること。

リスクとコンプライアンスの管理方法

ソリューションの開発を始める前にリスクとコンプライアンスの必要性を理解しておけば、後の監査に備えることができる。

AI関連リスク
風評リスク、規制リスク、オペレーショナルリスクなど、主要なリスクの側面を理解する。 ジェネレーティブAIと機械学習モデルを使用する場合、多くのリスクは同じだが、ジェネレーティブAIによって増幅されるリスクもあれば、ジェネレーティブAI特有のリスクもある。
たとえば、 基盤モデルモデルは事実と異なる、あるいは真実でない内容を含む出力を生成するかもしれない。
例えば、機械学習モデルは、あるグループに対して、他のグループよりも有利な結果をより頻繁に提供する傾向を示すかもしれない。
法規制遵守
遵守しなければならない法令、遵守状況を把握する方法、遵守を確保する方法を決定する。 例えば、AIソリューションに対して正式なリスクアセスメントや承認ワークフローが必要になるかもしれない。
ユースケース・ドキュメント
AIユースケースを作成し、モデルやプロンプトテンプレートをリクエスト段階から開発、本番まで管理するためのすべての情報を収集する。 ユースケースを文書化することで、組織が規制上の目的で文書化を要求しているか否かにかかわらず、進捗状況を追跡する便利な方法が提供される。

リスクとコンプライアンスの詳細

どの程度自動化するか、コード化するか

あなたと開発チームは、 watsonx.ai のユーザー・インターフェイスでさまざまなツールや手法を選択したり、完全にコードで作業したりすることができます:

コーディング言語
コードを書きたい場合は、REST API、 Python、 Node.js コードから選ぶことができる。 言語を選択する要因としては、開発者の好みやスキル、ソリューションのデプロイ方法、チームが対話型開発環境(IDE)と watsonx.ai ユーザー・インターフェイスのどちらでどの程度の作業を行いたいか、などがある。
自動化のレベル
ソリューション・コードをどの程度生成するかを選択できる:
  • コードなし:プロンプトエンジニアリング、モデルチューニング、ドキュメントの埋め込みとベクトル化のすべてのタスクをツールで完了できます。
    • 例えば、 AutoAI for RAGで最適なRAGパターンの検索を自動化し、 Prompt Lab でプロンプトテンプレートを作成し、Agent Labで エージェントを構築することができます。
    • 例えば、 AutoAI for machine learningで最適なデータアルゴリズム、変換、パラメータ設定の検索を自動化し、最適な予測モデルを作成することができます。 SPSS Modeler を使って、グラフィカルなキャンバス上で予測モデルを開発することができます。
  • いくつかのコード:多くのツールで Python ノートブックを生成し、必要に応じてコードを適合させることができる。
    • たとえば、プロンプトテンプレートに基づいてノートブックを生成したり、ドキュメントを埋め込んでベクトル化したり、AIエージェントを実装したりすることができます。
    • 例えば、 Decision Optimization ノートブックで処方分析の問題を解決することができる。
  • すべてのコード:IDEでREST APIを使ったコードを書くことができる。 ノートブックエディターを使って、 Python ライブラリを使ったコードを書いたり、実行したりすることができます。
機能
watsonx.ai 機能のほとんどは、ユーザーインターフェイスのツールと、APIやSDKのようなコードの両方で利用可能です。

作業方法の詳細

ジェネレーティブAIの基盤モデル選び方

AIソリューションの計画を立てる前に、 基盤モデル選択する必要はない。 しかし、どの基準があなたやあなたの組織にとって最も重要かを理解していれば、不適切な基盤モデル選択するリスクを減らすことができる。

タスク
基盤モデル求めるタスクは、 基盤モデル選択する際の制限要因になり得る。 多くのAIタスクでは、多くの基盤モデル中から選択することができる。 しかし、翻訳や英語以外の言語での応答など、他のAIタスクの場合、選択肢は少ない。
コスト
推論のコストは、 基盤モデル異なる。 推論コストを低く抑えることを優先するのであれば、より安価な基盤モデル、より小さな基盤モデル、量子化された基盤モデル、あるいはチューニング可能な基盤モデルモデルを選択する。
環境への影響
一般的に、より大きなモデルは、学習時と推論時の両方で環境に大きな影響を与える。 小さな基盤モデル量子化された基盤モデルモデルは、環境への影響が小さい。
精度とその他のスコア
基盤モデルベンチマークを比較し、あなたにとって最も重要な分野で高いスコアを獲得している基盤モデルモデルを選ぶことができます。
免責とモデル原産地
あなたの組織は、トレーニングデータについて透明性がある、オープンソースである、または補償を提供する基盤モデル選択する方針を持っているかもしれない。
カスタマイズ
基盤モデルモデルをチューニングすることで、特定のドメイン用にカスタマイズすることができる。 Tuning Studio の watsonx.ai で提供されているいくつかの基盤モデルチューニングを選択することができる。 あるいは、外部ツールで基盤モデル調整し、カスタム基盤モデル watsonx.ai にインポートすることもできます。
IBM Granite モデルには、 InstructLab で知識やスキルを追加することができる。
自社のデータセンターに基盤モデル導入したい場合は、 watsonx.ai。

基盤モデル選択に関する詳細

AIに必要なデータを準備するには

基盤モデル大量のデータで訓練されるが、社内のデータでは訓練されない。 基盤モデルモデルに自社のデータを知ってもらう必要がある場合、データをどのようにモデルに提供するかを決めなければならない。

グラウンディング文書
文書内の情報をモデルにグラウンディング質問に答えるソリューションが必要な場合は、 検索拡張生成 (RAG)パターンを設定することができる。 RAGパターンでは、ユーザーの質問に答える文章を効率的に検索するために、文書をベクトル化する。
チューニングとテストデータ
分類、要約、生成などの自然言語処理タスク用に出力を改善したり調整したりする必要がある場合は、 基盤モデル調整することができます。 あなたのプロンプトの品質をテストしたい場合は、生成AIメトリクスで評価することができます。 どちらのタスクでも、有効なプロンプトの入力と出力の例を提供しなければならない。 データに個人を特定できる情報(PII)などの機密情報が含まれている場合は、PIIに関する組織のポリシーを確認してください。 例えば、 基盤モデルチューニングやテストのために、PIIをマスクしたり、合成データを生成したりする必要があるかもしれない。
知識または技能
基盤モデル情報を提供するデータセットを提供する。 IntructLab、既存の基盤モデルモデルを、ユースケースに必要な機能で補強することができる。 あなたは、 基盤モデルチューニングを指示するための合成データを生成するための基礎となる、シード例またはグラウンディングデータを提供します。

遺伝子AIのためのデータ準備の詳細

品質評価とリスク軽減の方法

品質をどのように測定し、安全性を確保するかを決めなければならない。

評価
業界標準の指標に照らして、ソリューションのパフォーマンスとリスクを評価できます。 これらの指標は、AIソリューションに偏りがなく、ビジネス・ユーザーが容易に説明・理解でき、ビジネス・トランザクションにおいて監査可能であることを保証するのに役立つ。
基盤モデル出力のテキスト精度、類似度、品質を測定できます。 また、モデル出力の公平性、パフォーマンス、ドリフトを評価することもできます。 複数の資産パフォーマンスを同時に評価し、結果の比較分析を見て、最適なソリューションを特定することができます。
機械学習モデルのデプロイメント結果を、公平性、品質、ドリフト、説明可能性について監視できます。
リスク・アセスメント
リスクアセスメントの質問票に記入することで、潜在的なリスクを特定することができます。
ガードレール
プロンプトの入力テキストと出力テキストの両方から、有害な可能性のあるコンテンツやPIIコンテンツを削除するガードレールを有効にすることができます。
テスト
敵対的な攻撃をエミュレートするレッドチームの設置を検討する。

品質を評価し、リスクを軽減するための詳細情報

基盤モデル最適化と管理方法

精度、コスト、推論レイテンシ、モデルライフサイクルの制御のために、 基盤モデルモデルを最適化することができます。

デフォルトの最適化
IBM は、マルチテナント・ハードウェア上に展開される一連の基盤モデル提供する。 トークンごとに推論料を支払う。 IBM は、モデルを更新したり非推奨にしたりすることで、モデルのライフサイクルを制御します。 モデルが非推奨になった場合、新しいバージョンのモデルか別のモデルを推論するようにソリューションを更新しなければなりません。
精度とコストの最適化
より小さな基盤モデル推論することで、プロンプトの精度を向上させ、コストを削減する必要がある場合は、提供された基盤モデルモデルをチューニングすることができます。 マルチテナントのハードウェア上にチューニングされたモデルを展開し、トークンごとに推論費用を支払う。
精度とコントロールの最適化
ユースケースに合わせて watsonx.ai の外部でモデルをトレーニングまたはチューニングした場合、カスタムモデルをインポートしてデプロイすることができます。 専用ハードウェアにモデルを配置する。 推論にかかる費用ではなく、モデルのホスティングにかかる費用を時間ごとに支払う。 モデルのライフサイクルをコントロールする。
レイテンシーとコントロールの最適化
お客様のソリューションが多数の同時ユーザーをサポートする必要がある場合、 IBM が専用ハードウェアで提供するデプロイ・オンデマンド・モデルを導入することができます。 専用のハードウェアは、マルチテナントのハードウェアよりもレイテンシーが低い。 推論にかかる費用ではなく、モデルのホスティングにかかる費用を時間ごとに支払う。 モデルのライフサイクルをコントロールする。

基盤モデル最適化と管理に関する詳細

ソリューションの提供方法とメンテナンス

AIソリューションをどのように提供し、その継続的な品質を確保するかを決定しなければならない。

ソリューションの展開
AI 資産 デプロイメント・スペースデプロイし、 デプロイメント取得してアプリケーションでAIソリューションを呼び出す。
基盤モデル推論する場合、モデルを推論するエンドポイントは、コード・スニペット、 Python 関数、AI サービス、またはチームが開発したコードにあるかもしれない。
機械学習ソリューションの場合、エンドポイントは機械学習モデル、 Python 関数、R Shiny アプリケーション、NLP モデル、またはスクリプトかもしれない。
デプロイメント・スペース ModelOps の管理
ソリューションのテスト版、ステージング版、本番版用に別々のデプロイメント・スペース作成することで、 ModelOps フローをサポートできます。 各スペースに適切なコラボレーターを追加することで、プロダクションソリューションへのアクセスを管理できます。
MLパイプラインのオーケストレーション
機械学習モデルと Python スクリプトを作成、トレーニング、デプロイ、更新するパイプラインを組み立て、構成できます。
モニター
開発中のソリューションの評価と同様に、公平性、品質、説明可能性など、ソリューションのパフォーマンスやリスクを監視することができます。 経時的なトレンドを表示し、パフォーマンスが低下したときに警告を発するしきい値を設定することができます。
ユーザー・フィードバック
ユーザーフィードバックの仕組みを導入し、そのフィードバックを集めてソリューションを改善するプロセスを作ることを検討する。
たとえば、RAGパターンを実装すれば、ユーザーが質問に対する回答を評価するためのフィードバック・メカニズムを追加できる。 不正解や不適切な解答を評価するプロセスを設定し、RAGパターンを適応させるか、より良い解答を提供するためにコンテンツを適応させることができます。

配送とメンテナンスに関する詳細

詳細情報

親トピック 生成的AIソリューションの計画