さまざまなサービスで Cloud Pak for Data を使用して、AI 運用のための信頼できるデータ基盤を構築するのに役立つユース・ケースを実装できます。
データ・ファブリック・ソリューションの概要
Cloud Pak for Dataにデータ・ファブリック・ソリューションを実装すると、データ・アクセス、データ品質、データ・ガバナンス、およびデータ・ライフサイクルの管理に関する課題を解決できます。
Cloud Pak for Data 上のデータ・ファブリック・ソリューションは、データ・ライフサイクルを管理および自動化するための以下の主要な機能を提供します。
- データ・アクセス
- 既存のデータ・アーキテクチャー内の複数のクラウドとオンプレミスにわたるデータにアクセスします。
- セルフサービス使用量
- カタログ内で企業全体のデータやその他の資産を共有して使用します。
- 蓄積された知識
- 共通のビジネス・ボキャブラリーを使用してデータを理解します。 履歴、リネージュ、品質分析を通じてデータを信頼します。
- コラボレーションによるイノベーション
- 他のユーザーと連携して洞察を発見します。 あらゆるレベルの経験に対応する一連の統合ツールを使用して、データを準備して分析します。
- ガバナンスおよびコンプライアンス
- データ・プライバシーを適用するルールを定義します。
- 統一ライフサイクル
- データ・パイプラインのビルド、テスト、デプロイ、およびモニターを自動化します。
次の図は、 Cloud Pak for Data プラットフォーム (クラウドとオンプレミスの両方) で、ハイブリッド・データ・ソース (データレイクハウス、データウェアハウス、データレイク、データベース、またはビジネス・アプリケーションなど) へのアクセスを単一の UI エクスペリエンスに統合することで、データ・ファブリックがユース・ケースをどのようにサポートするかを示しています。
資産の価値
データ・ファブリックを使用すると、意味と価値を蓄積する資産にデータを変換できます。 資産は単なるデータではありません。 データ・ソースへの接続を初めて作成するときには、データ、表、スキーマ、およびデータ値にアクセスする方法に関する基本情報が得られます。 プロジェクトと呼ばれるワークスペースでデータを仮想化、変換、または複製することにより、データの取り込み中に値の追加を開始します。
データをキュレートするときに、データ資産にメタデータを追加します。 データのプロファイルを作成して分類し、値に関する統計を収集します。 組織のデータのセマンティックの意味を記述するビジネス・ボキャブラリーを使用して、資産をエンリッチします。 データ品質を分析します。 キュレーション中に追加するメタデータは、機械学習プロセスによって自動的に生成されるため、アクティブ・メタデータと見なされます。 データ変更後にキュレーションを再実行すると、自動データ分析に基づいてメタデータが更新されます。
ユーザーは、プロジェクトで資産を使用する際に、資産の使用方法と資産間の関係の履歴を記述する第 3 レベルの意味を作成します。 ユーザーは、ノートブックまたはダッシュボードでデータを分析したり、機械学習モデルをトレーニングしたりできます。
ユーザーは、評価やレビュー、データの視覚化、タグ、その他の関係などの情報を資産に追加することもできます。
以下のイメージは、基本情報 (データのタイプ、フォーマットとスキーマ、およびデータが存在する場所) に、記述情報 (データ・プロファイル、データ品質、およびビジネス・ボキャブラリー)、使用情報 (データと関係に対するアクション)、およびユーザー追加情報 (評価とレビュー、視覚化、および関係) を追加することによって、データ・ファブリック内でデータ資産がどのように価値を蓄積するかを示しています。
データ・ファブリックのユース・ケース
Cloud Pak for Data は、データ・ファブリック・ソリューションの一部としていくつかのユース・ケースを提供します。 フィーチャーおよびツールを提供する 1 つ以上のサービスをインストールすることにより、各ユース・ケースで表されるようにデータ・ファブリックを実装します。 一部のサービスは、複数のユース・ケースに含まれています。
ユース・ケースは、データ・ファブリック・ソリューションの一部を実装する方法を表します。これにより、他のパーツを作成しながらチームが作業を開始できます。 任意のユース・ケースから開始して、必要に応じて他のユース・ケースを追加することができます。
- より成熟したデータ・ガバナンス・モデルがある場合は、データ・ガバナンスのユース・ケースで説明されているように、まずビジネス・ボキャブラリーを確立します。
- 価値実現までの時間を短縮したい場合は、データ統合ユース・ケースで説明されているように、データ仮想化またはデータ複製から始めます。
- ユーザーおよびシステムが顧客データの総合的で信頼性の高い統一されたビューを持つようにする必要がある場合は、マスター・データ管理ユース・ケースで説明されているように、レコード・データを個別のエンティティーに突き合わせて統合することから始めます。
それぞれのユース・ケースを検討して、達成できることと使用できるツールについて学習します。
データ・ガバナンス
ビジネスに関する知識を提供し、データ保護を定義するメタデータに基づいてガバナンスを実装します。 セルフサービス・カタログで高品質のデータ資産を提供します。 規制準拠のためのデータ・ガバナンスの適用を自動化します。
このユース・ケースのサービス: IBM Knowledge Catalog。
データ・ガバナンスのユース・ケースを参照してください。
データ統合
データを移動することなく、すべてのデータへのアクセスを簡素化および自動化します。 分散ランドスケープ全体のデータを調整して、データ・コンシューマーがすぐに使用可能な情報のネットワークを作成します。
このユースケースのサービスData Virtualization、DataStage,、IBM Knowledge Catalog。
データ統合のユース・ケースを参照してください。
Master Data Management
ドメイン間でデータを接続し、それをマッチングしてマスター・データ・エンティティーを作成することで、顧客とレコード・データの統合ビューを作成します。
このユース・ケースのサービス: IBM Match 360 with Watson。
AI ユース・ケースの構築と管理
AI ユース・ケースの構築と管理を実装すると、モデルの構築、AI ガバナンス、および AI ライフサイクルの管理の課題を解決できます。
Cloud Pak for Data での AI ユース・ケースの構築と管理により、AI ライフサイクルを管理および自動化するための以下の主要機能が提供されます。
- コラボレーションによるイノベーション
- 他のユーザーと連携して洞察を発見します。 あらゆるレベルの経験に対応した一連の統合ツールを使用して、データを準備し、データを分析し、モデルを構築します。
- ガバナンスおよびコンプライアンス
- AI モデルの詳細な履歴を追跡して文書化し、コンプライアンスを確保します。
- 統一ライフサイクル
- AI モデルの構築、テスト、デプロイ、およびモニターを自動化します。
Cloud Pak for Dataは、2つのAIユースケースを提供する。 各ユース・ケースを実装するには、フィーチャーとツールを提供する 1 つ以上のサービス・インスタンスを作成します。 一部のサービスは、複数のユース・ケースに含まれています。
いずれかのユース・ケースから開始し、必要に応じてもう一方のユース・ケースを追加することができます。
- 価値実現までの時間を短縮したい場合は、データ・サイエンスと MLOps のユース・ケースで説明されているように、データ・サイエンスから始めます。
- モデルが組織の目標および規制に準拠していることを確認する必要がある場合は、AI ガバナンスのユース・ケースで説明されているように、モデルの追跡を開始します。
それぞれのユース・ケースを検討して、達成できることと使用できるツールについて学習します。
データ・サイエンスと MLOps
データの準備、データの作成、デプロイ、モニター、およびモデルのリトレーニングを行う自動化ワークフローを使用して、データ分析とモデル作成を操作可能にします。
このユースケースに対応するサービス:watsonx.aiStudio、watsonx.aiRuntime、Watson OpenScale、IBM Knowledge Catalog。
Data Science and MLOps use caseを参照してください。
AIガバナンス
モデルの公平性、品質、説明可能性を強制する自動化されたワークフローを使用して、AI ガバナンスを運用可能にします。
このユースケースに対応するサービス:watsonx.aiStudio、watsonx.aiRuntime、Watson OpenScale、IBM Knowledge Catalog。
AI ガバナンスのユース・ケースを参照してください。