Cloud Pak for Data as a Service 上の Watson Knowledge Catalog

 

説明

Cloud Pak for Data as a Service のコア・サービスである Watson Knowledge Catalog には、検索しやすい高品質のデータ資産を提供する、セキュアなエンタープライズ・カタログ管理プラットフォームが組み込まれています。 このプラットフォームは、メタデータで資産をエンリッチするために使用するデータ・ガバナンス・フレームワークによってサポートされます。

Watson Knowledge Catalog は、 Cloud Pak for Data as a Service の一部であり、データ・ファブリック・アーキテクチャーのデータ・ガバナンス機能とプライバシー機能を提供します。

データ資産をキュレートし、そのプロパティーと意味を記述するガバナンス成果物でデータ資産をエンリッチすることにより、知識コアを開発します。 データ・スチュワードとデータ・エンジニアは、メタデータをインポートし、データ資産を準備し、ガバナンス成果物を割り当ててデータ資産をエンリッチし、資産をカタログに公開することで、データをキュレーションします。 一部のガバナンス成果物は事前定義されており、データ資産に自動的に割り当てられます。 データ・スチュワードは、ビジネス・ボキャブラリーを作成またはインポートして、データ・キュレーション中にデータ資産をさらに強化することができます。 Knowledge Accelerators には、特定の業界向けにすぐに使用できるビジネス・ボキャブラリーのセットが用意されています。 カテゴリーを使用して、誰がどの目的でガバナンス成果物を作成および使用できるかを制御します。

データの保護方法を定義するデータ保護ルールを作成できます。 データ保護ルールは、管理対象カタログ内で統一された方法で自動的に適用されます。 データ保護ルールを構成して、データの内容、形式、または意味に基づいて機密データをマスクしたり、データにアクセスするユーザーを識別したりすることができます。 データをマスクすると、機密データを表示する権限がないユーザーのデータがアンロックされ、データの複数のコピーを保持する必要がなくなります。

カタログを使用して企業全体で資産を検索して共有するためのセルフサービス方式を提供します。

  • カタログ内のコラボレーターは、個別の資格情報を必要とすることなく、また、資格情報を参照できなくても、データ資産にアクセスできます。 コラボレーターには、カタログ内で実行できるアクティビティーを制御する役割があります。
  • データ資産には、データへのアクセス方法、データ分類、割り当てられたビジネス用語とその他のガバナンス成果物、他の資産との関係、評価とレビューに関する情報が含まれています。 データ資産は、リレーショナル・データまたは非構造化データ (PDF 文書や Microsoft Office 文書など) にすることができます。
  • カタログ内の他のタイプの資産には、データ・サイエンティストがデータを処理するためのツール (モデル、ノートブック、ダッシュボードなど) を使用して作成する運用資産が含まれます。
  • データ資産のメタデータとプロパティー、および AI を活用した推奨に基づくセマンティック検索により、ユーザーは必要なデータを見つけることができます。

データサイエンティストは、カタログ内の資産を検索し、資産をプロジェクトにコピーし、そこで Watson Studio ツールおよび Watson Machine Learning ツールを使用してデータの分析やモデルの構築を行います。

クイック・リンク

統合サービス

表 1. 補足サービスを参照してください。 以下の補足サービスを使用して、このサービスの機能を拡張することができます。各サービスには、このサービスをインストールする必要があります。
サービス 機能
Watson Query 複数のタイプおよびロケーションにまたがるデータ・ソースを 1 つの論理データ・ビューに統合します。
IBM Match 360 with Watson (ベータ) 組織のビジネスの主要な事実に関する統合された中央ビューを取得し、マスター・データをそのライフサイクル全体にわたって管理します。
表 2. 関連サービス以下の関連サービスは、多くの場合、このサービスと一緒に使用され、補完機能を提供しますが、必須ではありません。
サービス 機能
Watson Studio データ・サイエンティスト、開発者、および対象分野の専門家向けのツールを使用して、コラボレーション環境でデータを準備、分析、およびモデル化します。
DataStage® 組み込みの検索、自動メタデータ伝搬、コンパイル・エラーの同時強調表示を使用して、企業の情報を変換および調整するジョブを作成、編集、ロード、および実行します。

互換性のあるデータ・ソース

互換性のあるデータ・ソース・サービスのリストについては、接続タイプを参照してください。