Cloud Pak for Data as a Service は、すべてのデータ・ガバナンス、データ・エンジニアリング、データ分析、および AI ライフサイクル・タスクのためのクラウド・サービス・プラットフォームです。 Cloud Pak for Data as a Service は、データ・ファブリック・ソリューションを実装しています。これにより、信頼できるデータへの即時かつ安全なアクセスを組織に提供し、プロセスとコンプライアンスを自動化し、アプリケーションで信頼できる AI を提供することができます。
Cloud Pak for Data as a Service は、完全に管理されたクラウド・サービス・プラットフォームであり、以下の利点があります。
- ソフトウェアまたはハードウェアのインストールも、管理も、更新もなし
- スケールアップまたはスケールダウンが簡単
- セキュリティーと準拠性の確保
- 構成可能サービス・アーキテクチャー
- サブスクリプションまたは使用量ベースの月次請求
このビデオを視聴して、 Cloud Pak for Data as a Service の概要を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
Cloud Pak for Data as a Service データ・ファブリック・ソリューション
データ・ファブリック・アーキテクチャーにより、企業はハイブリッド・マルチクラウド・データ・ランドスケープにおけるデータの価値を引き出すことができます。 データ・ファブリック・アーキテクチャーへの移行は、企業が分析、データ・サイエンス、顧客マスター・データ、およびコンプライアンスのためにデータを統合、管理、および使用する方法を変革します。
データ・ファブリックを使用すると、さまざまなソースからのデータにセキュアで一貫性のある方法でアクセスできます。 非効率的で、反復的で、手動によるデータ・アクセスと統合のプロセスをなくすことができます。 データ・ファブリック・アーキテクチャーは、ソース間のギャップを埋め、企業のニーズをサポートするためのビジネス対応データを提供します。 ハイブリッド・ランドスケープとマルチクラウド・ランドスケープ全体のさまざまなタイプのソースからのデータを処理できます。その一方で、幅広い統合データ管理機能により、そのデータの安全性と信頼性を維持します。
データ・エンジニアは、データを準備、変換、仮想化するためのツールを必要とします。 データ品質アナリストには、データの品質を測定するためのツールが必要です。 ガバナンス・チームには、データを制御、保護、および強化するためのツールが必要です。 ビジネス・アナリストやデータ・サイエンティストなどのデータ・コンシューマーは、洞察とモデルを共同で開発するためのツールを必要としています。 統合ツールの Cloud Pak for Data プラットフォームを使用すると、組織は効率的に連携してデータを使用し、ビジネスを向上させることができます。
データ・ファブリック・アーキテクチャーは、機械学習を使用してメタデータ処理を自動化するアクティブなメタデータ管理を実装します。 メタデータ分析の成果により、自動データ・ディスカバリーが促進され、データの信頼性が向上し、大規模なデータ保護とデータ・ガバナンスが可能になります。
データ・ファブリック・ソリューションについて詳しくは、 ユース・ケースを参照してください。 データ・ファブリックの実装を体験するには、 データ・ファブリックのチュートリアルを参照してください。
サービスおよびプラットフォーム・アーキテクチャー
サービスをプロビジョニングすることにより、 Cloud Pak for Data as a Service プラットフォームにフィーチャーおよびツールを追加します。 コア・サービスのセットが共通プラットフォームに統合されます。 その他の関連サービスはプラットフォームと連動しますが、プラットフォームの外部で実行されます。 Cloud Pak for Data as a Service への登録方法によっては、単一のデータ・ファブリック・ソリューションのユース・ケースを表すコア・サービスのサブセットから開始する場合があります。
Cloud Pak for Data as a Service サービス・カタログから以下のタイプのサービスをプロビジョンできます。
コア・サービス
コア・サービスはシームレスに統合され、ツール、ワークスペース、または計算能力をプラットフォーム UI に追加します。- watsonx.aiデータ分析用スタジオ
- watsonx.aiモデルの構築とデプロイのためのランタイム
- モデルを評価するための Watson OpenScale
- データおよびその他の資産を管理およびカタログするための IBM Knowledge Catalog
- データを統合するための DataStage
- データの仮想化とクエリーを行うData Virtualization
- マスター・データを作成するための Match 360
- データを複製するための Data Replication
- データを視覚化するための Cognos Dashboard Embedded
関連サービス
IBM Cloud データベース・サービス。プラットフォーム内からデータにアクセスするために使用できますが、プラットフォーム外でデータを保管および管理します。独自の UI を持つか、データを分析するための API を提供する Watson サービス。
ワークスペースと資産
Cloud Pak for Data as a Service は、チームや組織で作業できる一連のコラボレーション・ワークスペースとして編成されています。 各ワークスペースには、アクションを実行する権限を提供するロールを持つメンバーのセットがあります。 ほとんどのユーザーは、アセットを処理します。アセットは、ユーザーがプラットフォームに追加するアイテムです。 データ資産には、データを表すメタデータが含まれます。一方、データ・パイプラインやモデルなどのツールで作成した資産は、データを処理するためにコードを実行します。 以下の図は、メイン・ワークスペース、その目的、および資産とその他の項目がプラットフォーム内をどのように移動するかを示しています。
プロジェクト
プロジェクトとは、データ・サイエンス・チーム、データ・エンジニアリング・チーム、またはデータ・キュレーション・チームが、ノートブック、ダッシュボード、モデル、データ・パイプライン、またはエンリッチ・データ資産などの資産を作成するためにデータを処理する場所です。 プロジェクト・ツールは、ほとんどのコア・サービスによって提供されます。
- watsonx.aiStudio は、Data Refinery、Jupyternotebooks editor、SPSS Modeler、Decision Optimization、Pipelines、および RStudio ツールを提供します
- watsonx.aiランタイムはAutoAIと統合学習ツールを提供する
- IBM Knowledge Catalog には、 Data Refinery、 Metadata import、メタデータ・エンリッチメント、およびマスキング・フローのツールが用意されています。
- DataStage には、 DataStage データ・パイプライン・エディターが用意されています。
- Cognos Dashboard Embedded には、ダッシュボード・エディターが用意されています。
- Data Replication は、 Data Replication ツールを提供します。
- Match 360 は、マスター・データ構成ツールを提供します。
以下の図は、プロジェクトの「概要」ページがどのように表示されるかを示しています。
カタログ
カタログは、組織が高品質の信頼できるデータやその他の資産 (モデル・ファクトシートなど) を見つけて保管する場所です。 カタログ内のデータ資産を検索し、それらをプロジェクトに移動してデータを処理することができます。 または、プロジェクト内のデータをキュレートし、高品質のデータ資産をカタログに公開して、他のユーザーが使用できるようにすることができます。 カタログには、 IBM Knowledge Catalog サービスが必要です。
次の図は、カタログの「資産」ページの外観を示しています。
展開スペース
デプロイメント・スペースは、 ModelOps チームがモデルおよびその他のデプロイ可能な資産を実動にデプロイしてから、実動でデプロイメントをテストおよび管理する場所です。 プロジェクトでモデルおよびデプロイ可能資産を作成した後、それらをデプロイメント・スペースにプロモートします。
以下の図は、デプロイメント・スペースの「概要」ページの外観を示しています。
カテゴリー
カテゴリーは、カタログ内のデータ資産を強化するガバナンス成果物をガバナンス・チームが作成および管理する場所です。 カテゴリーには、 IBM Knowledge Catalog サービスが必要です。
以下の図は、カテゴリーがどのように表示されるかを示しています。
その他のワークスペース
他のワークスペースで特殊なデータ資産を作成し、それらをプロジェクトおよびカタログに移動することができます。
- Data Virtualizationサービスは、多数のデータソースにまたがるデータ資産を仮想化するワークスペースを提供する。
- Match360 サービスは、顧客データの 360 度ビューを構成して探索するためのワークスペースを提供します。
リソース・ハブ
このプラットフォームには、サンプル・データ資産、ノートブック、およびプロジェクトを提供する統合リソース・ハブが含まれています。 サンプル・ノートブックには、データ・サイエンスと機械学習のコードの例が記載されています。 業界アクセラレーターを含むサンプル・プロジェクトには、一連のデータ、モデル、その他の資産、および特定のビジネス問題の解決方法に関する詳細な指示が含まれています。 リソース・ハブは、 Knowledge Acceleratorsも提供します。これには、特定の業界向けのビジネス・ボキャブラリーを提供するためにインポートできるガバナンス成果物のセットが含まれています。
以下のイメージは、リソース・ハブの外観を示しています。
リソース・ハブのツアーを見るには、このビデオをご覧ください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。