サービスとしてのCloud Pak for Data 上の Watson KnowledgeCatalog

説明

Cloud Pak for Data as a Service のコア・サービスである Watson Knowledge Catalog には、検索しやすい高品質のデータ資産を提供する、セキュアなエンタープライズ・カタログ管理プラットフォームが組み込まれています。 このプラットフォームは、無許可ユーザーによる機密情報へのアクセスを防止することで、データ・アクセスがビジネス・ルールおよび標準に確実に準拠するようにするために使用するデータ・ガバナンス・フレームワークによってサポートされます。

データ資産をキュレートし、そのプロパティーと意味を記述するガバナンス成果物でデータ資産をエンリッチすることにより、知識コアを開発します。 データ・スチュワードとデータ・エンジニアは、メタデータをインポートし、データ資産を準備し、ガバナンス成果物を割り当ててデータ資産をエンリッチし、資産をカタログに公開することで、データをキュレーションします。 一部のガバナンス成果物は事前定義されており、データ資産に自動的に割り当てられます。 データ・スチュワードは、ビジネス・ボキャブラリーを作成またはインポートして、データ・キュレーション中にデータ資産をさらに強化することができます。 Knowledge Accelerators には、特定の業界向けにすぐに使用できるビジネス・ボキャブラリーのセットが用意されています。 カテゴリーを使用して、誰がどの目的でガバナンス成果物を作成および使用できるかを制御します。

プラットフォーム全体でデータを保護するデータ保護ルールを作成できます。 データ保護ルールは、統一された方法で自動的に適用されます。 データ保護ルールを構成して、データの内容、形式、または意味に基づいて機密データをマスクしたり、データにアクセスするユーザーを識別したりすることができます。 データをマスクすると、機密データを表示する権限がないユーザーのデータがアンロックされ、データの複数のコピーを保持する必要がなくなります。

カタログを使用して企業全体で資産を検索して共有するためのセルフサービス方式を提供します。

  • カタログ内のコラボレーターは、個別の資格情報を必要とすることなく、また、資格情報を参照できなくても、データ資産にアクセスできます。 コラボレーターには、カタログ内で実行できるアクティビティーを制御する役割があります。
  • データ資産には、データへのアクセス方法、データ分類、割り当てられたビジネス用語とその他のガバナンス成果物、他の資産との関係、評価とレビューに関する情報が含まれています。 データ資産は、リレーショナル・データまたは非構造化データ (PDF 文書や Microsoft Office 文書など) にすることができます。
  • カタログ内の他のタイプの資産には、データ・サイエンティストがデータを処理するためのツール (モデル、ノートブック、ダッシュボードなど) を使用して作成する運用資産が含まれます。
  • データ資産のメタデータとプロパティー、および AI を活用した推奨に基づくセマンティック検索により、ユーザーは必要なデータを見つけることができます。

データサイエンティストは、カタログ内の資産を検索し、資産をプロジェクトにコピーし、そこで Watson Studio ツールおよび Watson Machine Learning ツールを使用してデータの分析やモデルの構築を行います。

クイック・リンク

統合サービス

表 1. 補足サービス
サービス 機能
Watson 照会 複数のタイプおよびロケーションにまたがるデータ・ソースを 1 つの論理データ・ビューに統合します。
IBM Match 360 with Watson (ベータ) 組織のビジネスの主要な事実に関する統合された中央ビューを取得し、マスター・データをそのライフサイクル全体にわたって管理します。
表 2. 関連サービス
サービス 機能
Watson Studio データ・サイエンティスト、開発者、および対象分野の専門家向けのツールを使用して、コラボレーション環境でデータを準備、分析、およびモデル化します。

互換性のあるデータ・ソース

互換性のあるデータ・ソース・サービスのリストについては、接続タイプを参照してください。