IBM watsonx as a Service の概要
IBM watsonx.ai は、基盤モデルを採用した生成 AI 機能を使用し、機械学習モデルを構築するための統合ツールのスタジオです。 IBM watsonx.ai コンポーネントは、組織の信頼できるデータにアクセスし、AI プロセスを自動化し、アプリケーションで AI を提供することができる、安全でコラボレーティブな環境を提供します。 IBM watsonx.governance コンポーネントは、責任ある、透明性のある説明可能な AI ワークフローを加速するために、機械学習モデルと生成 AI モデルのエンドツーエンド・モニターを提供します。
watsonx.aiを紹介する短いビデオをご覧ください。
watsonx.dataをお探しですか? IBM watsonx.data の資料にアクセスしてください。
watsonxを使用すると、以下の目標を達成できます。
- 機械学習モデルの構築
- オープン・ソース・フレームワークと、コード・ベース、自動化、またはビジュアル・データ・サイエンス・ツールを使用して、モデルを作成します。
- 基盤モデルの実験
- 入力テキストからコンテンツを生成、分類、要約、または抽出するプロンプトをテストします。 IBMモデルまたはHugging Faceのオープン・ソース・モデルから選択します。
- AI ライフサイクルの管理
- AI モデルをトレーニング、検証、およびデプロイするためのすべての統合ツールとランタイムを使用して、AI モデルのライフサイクル全体を管理および自動化します。
- AI の管理
- AI モデルの詳細な履歴を追跡して文書化し、コンプライアンスを確保します。
Watsonx.ai は、データおよびモデルを処理するための以下のツールを提供します。
使用できるもの | 実行できる操作 | 使用時に最適 |
---|---|---|
Data Refinery | 多様なデータ・ソース接続からデータにアクセスし、洗練します。 他のデータ・サイエンティストが分析および探索するためにデータを結合、結合、またはフィルタリングする可能性があるスナップショットとして、結果のデータ・セットを具体化します。 |
データをシェーピングまたはクレンジングする場合は、データを視覚化する必要があります。 分析のために大量の生データを準備するプロセスを単純化する必要があります。 |
プロンプト・ラボ | プロンプトを入力して、 IBM とオープン・ソースの基盤モデルを試します。 | 生成される AI ソリューションのためのプロンプトを作成する必要があります。 |
Studioのチューニング | ニーズにより適合するように、基盤モデルが返す出力を調整します。 | 生成 AI ソリューションで使用するためにファウンデーション・モデル出力を調整したいと考えています。 |
AutoAI | AutoAI を使用して、アルゴリズムを自動的に選択し、機能を設計し、パイプライン候補を生成し、機械学習モデル・パイプライン候補をトレーニングします。 次に、ランク付けされたパイプラインを評価し、最良のものをモデルとして保存します。 トレーニング済みモデルをスペースにデプロイするか、 AutoAI から任意のモデル・トレーニング・パイプラインをノートブックにエクスポートして詳細化します。 |
優れたトレーニング・パイプラインと機械学習モデルのセットを素早く構築するための高度な自動化された方法が必要です。 生成されたパイプラインをエクスポートして、それらを詳細化できるようにする必要があります。 |
ノートブックおよびスクリプト | Python ライブラリーを使用したプロンプト・基盤モデル。 ノートブックおよびスクリプトを使用して、 Python または R で独自のフィーチャー・エンジニアリング、モデル・トレーニング、および評価コードを作成します。 プロジェクトで使用可能なトレーニング・データ・セット、またはデータベース、データレイク、オブジェクト・ストレージなどのデータ・ソースへの接続を使用します。 任意のオープン・ソース・フレームワークおよびライブラリーを使用してコーディングします。 |
Python または R のコーディング・スキルを使用して、モデルの処理に使用するコードを完全に制御します。 |
SPSS Modeler フロー | SPSS Modeler フローを使用して、独自の機械学習モデルのトレーニング・フロー、評価フロー、およびスコアリング・フローを作成します。 プロジェクトで使用可能なトレーニング・データ・セット、またはデータベース、データレイク、オブジェクト・ストレージなどのデータ・ソースへの接続を使用します。 | データを探索し、機械学習モデルのトレーニング・フロー、評価フロー、およびスコアリング・フローを定義するための簡単な方法が必要です。 |
RStudio | RStudio で R を使用してデータを分析し、機械学習モデルを作成してテストします。 | R で作業するために開発環境を使用したいとします。 |
Decision Optimization | Watson Machine Learningを使用して、データの準備、モデルのインポート、問題の解決、シナリオの比較、データの視覚化、ソリューションの検索、レポートの作成、デプロイするモデルの保存を行います。 | 処方的分析の問題に対する最適なソリューションを見つけるには、何百万もの可能性を評価する必要があります。 |
統合学習 | 分散データを使用する一般的な機械学習モデルをトレーニングします。 | 複数の場所に分散されたデータを移動、結合、または共有することなく、機械学習モデルをトレーニングする必要があります。 |
Watson Pipelines | パイプラインを使用して、ノートブック、 Data Refinery、および機械学習パイプラインを自動化する反復可能なスケジュール・フローを、データ取り込みからモデルのトレーニング、テスト、およびデプロイメントに至るまで作成します。 | MLOps フロー内の一部またはすべてのステップを自動化する必要があります。 |
Synthetic Data Generator | ビジュアル・フローおよびモデリング・アルゴリズムを使用して、実動データまたはカスタム・データ・スキーマに基づいて合成表データを生成します。 | 実動データをマスクまたは模倣するか、カスタム・データ・スキーマから合成データを生成する必要がある。 |
Watsonx.governance は、モデルを管理するための以下のツールを提供します。
使用できるもの | 実行できる操作 | 使用時に最適 |
---|---|---|
ファクト・シート | モデル・ライフサイクルの状況、一般的なモデルとデプロイメントの詳細、トレーニング情報とメトリック、およびデプロイメント・メトリックを表示します。 | モデルが準拠しており、期待どおりに実行されていることを確認する必要があります。 |
Watson OpenScale | モデル出力をモニターし、モデル予測を説明します。 | モデルを公平に保ち、モデル予測を説明できるようにする必要があります。 |
データとモデルのセキュリティーとプライバシー
watsonxでの作業 (作成するデータとモデルを含む) は、アカウントに対してプライベートになります。
- お客様のデータには、お客様のみがアクセスできます。 データは、モデルのトレーニングにのみ使用されます。 IBM やその他の個人や組織がお客様のデータにアクセスしたり、データを使用したりすることは決してありません。 データは、 IBM Cloud Object Storage サービス・インスタンスの専用ストレージ・バケットに保管されます。 データは保存中も移動中も暗号化されます。
- 作成したモデルには、ユーザーのみがアクセスできます。 IBM やその他の個人や組織がモデルにアクセスしたり、モデルを使用したりすることは決してありません。 モデルは、データと同じ方法で保護されます。
セキュリティーとオプションについて詳しくは、以下を参照してください。
基礎となるアーキテクチャー
Watsonx には、組織が効率的にコラボレーションするためのセキュアかつスケーラブルな基盤として、以下の機能が組み込まれています。
- ソフトウェアおよびハードウェア
- Watsonx は、 IBM Cloud上の IBM によって完全に管理されます。 ソフトウェア更新は自動的に行われます。 コンピュート・リソースとストレージのスケーリングは自動的に行われます。
- ストレージ
- ストレージを提供するために、 IBM Cloud Object Storage サービス・インスタンスが自動的にプロビジョンされます。
- 計算リソース
- ジョブに適したランタイムを選択できます。 計算リソース使用量は、ランタイム環境の料金とそのアクティブな期間に基づいて請求されます。
- セキュリティー、コンプライアンス、および分離
- watsonx のデータ・セキュリティー、ネットワーク・セキュリティー、セキュリティー標準への準拠、および分離は、 IBM Cloudによって管理されます。 追加のセキュリティーと暗号化のオプションをセットアップできます。
- ユーザーの管理
- IBM Cloud Identity and Access Management を使用して、ユーザーおよびユーザー・グループを追加し、アカウントの役割と権限を管理します。 プラットフォーム全体の各コラボレーション・ワークスペース内で役割を割り当てます。
- グローバル検索
- プラットフォーム全体で資産を検索できます。
- データ・ソースへの共有接続
- Platform assets catalogで、プラットフォーム全体で他のユーザーと接続を共有できます。
- サンプル
- IBMがキュレートしたサンプル・データ・セット、ノートブック、プロジェクト、およびモデルを試すことができます。
watsonx プラットフォームの Watsonx.ai には、 Watson Studio、 Watson Machine Learning、および IBM Cloud Object Storage サービスが含まれています。 watsonx プラットフォームの Watsonx.governance には、 watsonx.governance サービスが含まれています。
ワークスペースと資産
Watsonx は、チームや組織で作業できるコラボレーション・ワークスペースのセットとして編成されています。 各ワークスペースには、アクションを実行する権限を提供するロールを持つメンバーのセットがあります。 ほとんどのユーザーは、ユーザーがプラットフォームに追加する項目である資産を処理します。 データ資産には、データを表すメタデータが含まれます。一方、モデルなどのツールで作成した資産は、データを処理するためにコードを実行します。 プロジェクト内の資産を作成し、デプロイメント・スペース内の完了した資産のデプロイメントを管理します。
プロジェクトおよびツール
プロジェクトは、データ・サイエンスおよびモデル・ビルダー・チームがデータを処理して、保存されたプロンプト、ノートブック、モデル、またはパイプラインなどの資産を作成する場所です。 最初のプロジェクト (サンドボックス・プロジェクトと呼ばれます) は、 watsonx.aiに登録すると自動的に作成されます。
以下の図は、プロジェクトの「概要」ページがどのように表示されるかを示しています。
展開スペース
デプロイメント・スペースは、 ModelOps チームがモデルおよびその他のデプロイ可能な資産を実動にデプロイし、実動でデプロイメントをテストおよび管理する場所です。 プロジェクトでモデルおよびデプロイ可能資産を作成した後、それらをデプロイメント・スペースにプロモートします。
以下の図は、デプロイメント・スペースの「概要」ページの外観を示しています。
サンプル
このプラットフォームには、モデル、データ資産、プロンプト、ノートブック、およびサンプル・プロジェクトを提供するサンプルの統合コレクションが含まれています。 サンプル・ノートブックには、データ・サイエンスと機械学習のコードの例が記載されています。 サンプル・プロジェクトには、データ、モデル、その他の資産のセット、および特定のビジネス問題の解決方法に関する詳細な説明が含まれています。
以下のイメージは、サンプルがどのように表示されるかを示しています。
- サンプル・コレクションのツアーを見る