データ・ファブリック・ソリューションの概要
Cloud Pak for Dataにデータ・ファブリック・ソリューションを実装すると、データ・アクセス、データ品質、データ・ガバナンス、およびデータと AI のライフサイクルの管理に関する課題を解決できます。
Cloud Pak for Data のデータ・ファブリック・ソリューションは、データと AI のライフサイクルを管理および自動化するための以下の主要な機能を提供します。
- データ・アクセス
- 既存のデータ・アーキテクチャー内の複数のクラウドとオンプレミスのデータにアクセスできます。
- セルフサービスの利用
- カタログ内の企業全体のデータやその他の資産を共有して使用します。
- 蓄積された知識
- 一般的なビジネス・ボキャブラリーを通じてデータを理解します。 履歴、リネージュ、品質分析を通じてデータを信頼します。
- 連携によるイノベーション
- Collaborate with others to discover insights. あらゆるレベルの経験に対応した一連の統合ツールを使用して、データを準備し、データを分析し、モデルを構築します。
- ガバナンスおよびコンプライアンス
- データ・プライバシーを適用するルールを定義します。 AI モデルの詳細な履歴を追跡して文書化し、コンプライアンスを確保します。
- 統一ライフサイクル
- データ・パイプラインと AI モデルの作成、テスト、デプロイ、およびモニターを自動化します。
次の図は、単一の UI エクスペリエンスで機能を使用してハイブリッド・データ・ソースへのアクセスを統合することで、 Cloud Pak for Data プラットフォーム上のユース・ケースをデータ・ファブリックがどのようにサポートするかを示しています。
資産の価値
データ・ファブリックを使用すると、意味と価値を蓄積する資産にデータを変換できます。 資産は単なるデータではありません。 データ・ソースへの接続を初めて作成するときには、データ、表、スキーマ、およびデータ値にアクセスする方法に関する基本情報が得られます。 プロジェクトと呼ばれるワークスペースでデータを仮想化、変換、または複製することにより、データの取り込み中に値の追加を開始します。
データをキュレートするときに、データ資産にメタデータを追加します。 データのプロファイルを作成して分類し、値に関する統計を収集します。 組織のデータのセマンティックの意味を記述するビジネス・ボキャブラリーを使用して、資産をエンリッチします。 データ品質を分析します。 キュレーション中に追加したメタデータは、機械学習プロセスによって自動的に生成されるため、アクティブ・メタデータと見なされます。 データ変更後にキュレーションを再実行すると、自動データ分析に基づいてメタデータが更新されます。
ユーザーは、プロジェクトで資産を使用する際に、資産の使用方法と資産間の関係の履歴を記述する第 3 レベルの意味を作成します。 ユーザーは、ノートブックまたはダッシュボードでデータを分析したり、機械学習モデルをトレーニングしたりできます。
ユーザーは、評価やレビュー、データの視覚化、タグ、その他の関係などの情報を資産に追加することもできます。
以下のイメージは、データ資産がデータ・ファブリック内でどのように価値を蓄積するかを示しています。
モデルも資産です。 モデルのデプロイメントと入力データ、モデル間の比較、企業プロトコルへの準拠、およびその他のパフォーマンス・メトリックを追跡できます。
ユース・ケース
Cloud Pak for Data as a Service は、データ・ファブリック・ソリューションの一部として 4 つのユース・ケースを提供します。 フィーチャーおよびツールを提供する 1 つ以上のサービス・インスタンスを作成することにより、各ユース・ケースで表されるようにデータ・ファブリックを実装します。 一部のサービスは、複数のユース・ケースに含まれています。
ユース・ケースは、データ・ファブリック・ソリューションの一部を実装する方法を表します。これにより、チームは他のパーツを作成しながら作業を開始できます。 任意のユース・ケースから開始して、必要に応じて他のユース・ケースを追加することができます。
- より成熟したデータ・ガバナンス・モデルがある場合は、データ・ガバナンスのユース・ケースで説明されているように、まずビジネス・ボキャブラリーを確立します。
- 価値実現までの時間を短縮したい場合は、データ統合およびデータ・サイエンスと MLOps のユース・ケースで説明されているように、データ仮想化またはデータ・サイエンスから始めます。
- モデルが組織の目標および規制に準拠していることを確認する必要がある場合は、AI ガバナンスのユース・ケースで説明されているように、モデルの追跡を開始します。
それぞれのユース・ケースを検討して、達成できることと使用できるツールについて学習します。
データ・ガバナンス
ビジネスに関する知識を提供し、データ保護を定義するメタデータに基づいてガバナンスを実装します。 セルフサービス・カタログで高品質のデータ資産を提供します。 規制準拠のためのデータ・ガバナンスの適用を自動化します。
このユース・ケースのサービス: Watson Knowledge Catalog および IBM Match 360 with Watson。
データ・ガバナンスのユース・ケースを参照してください。
データ統合
データを移動することなく、すべてのデータへのアクセスを簡素化および自動化します。 分散ランドスケープ全体のデータを調整して、データ・コンシューマーがすぐに使用可能な情報のネットワークを作成します。
このユース・ケースのサービス: Watson Query、 DataStage、および Watson Knowledge Catalog。
データ統合のユース・ケースを参照してください。
データ・サイエンスと MLOps
データの準備、データの作成、デプロイ、モニター、およびモデルのリトレーニングを行う自動化ワークフローを使用して、データ分析とモデル作成を操作可能にします。
このユース・ケースのサービス: Watson Studio、 Watson Machine Learning、 Watson OpenScale、および Watson Knowledge Catalog。
Data Science and MLOps use caseを参照してください。
AIガバナンス
モデルの公平性、品質、説明可能性を強制する自動化されたワークフローを使用して、AI ガバナンスを運用可能にします。
このユース・ケースのサービス: Watson Studio、 Watson Machine Learning、 Watson OpenScale、および Watson Knowledge Catalog。
AI ガバナンスのユース・ケースを参照してください。