サービスとしてのCloud Pak for Data 上の Watson Studio

説明

Watson Studio は、Cloud Pak for Data as a Service のコア・サービスの 1 つです。

Watson Studio には、ビジネス上の問題を解決するためにデータを共同で処理するための環境とツールが用意されています。 データの分析と視覚化、データのクレンジングとシェーピング、ストリーミング・データの取り込み、または、機械学習モデルの作成とトレーニングを行うために必要なツールを選択できます。

以下の図は、プロジェクトを中心としたWatson Studio のアーキテクチャーを示しています。 プロジェクトは、リソースを編成し、データを処理するワークスペースです。

プロジェクトに資産とツールがどのように含まれ、データ・ソース、ギャラリー、およびカタログからの入力があるかを示す図。

プロジェクトには以下のタイプのリソースを含めることができます。

  • コラボレーターは、データを処理するチームのメンバーです。データサイエンティスト・タスクには、データの分析とモデルの作成が含まれます。 データ・エンジニア・タスクには、データの準備と統合が含まれます。
  • データ資産は、アップロードされたファイル内のデータ、またはデータ・ソースへの接続を介してアクセスされるデータを指します。
  • 運用資産は、データに対してコードを実行するために作成するオブジェクト (スクリプトやモデルなど) です。
  • ツールは、データから洞察を得るために使用するソフトウェアです。以下のツールが Watson Studio サービスに含まれています。
    • Data Refinery: データを準備および視覚化します。
    • Jupyter notebook エディター: Jupyter notebooks をコーディングします。
    • RStudio: R および R Shiny アプリで Jupyter notebooks をコーディングします。
    • SPSS Modeler: SPSS アルゴリズムを使用するモデルを介してデータのフローを自動化します。
    • Decision Optimization モデル・ビルダー: ビジネス上の問題を解決するシナリオを最適化します。
      その他のプロジェクト・ツールを使用するには、追加のサービスが必要です。 補足のリストと
      関連サービスを参照してください。

Watson Studio プロジェクトは、カタログおよびデプロイメント・スペースと完全に統合されています。

  • カタログは Watson Knowledge Catalog サービスによって提供されます
    • プロジェクトとカタログの間で資産を簡単に移動できます。
    • カタログとプロジェクトは、同じタイプのデータ資産をサポートします。
    • プロジェクトに追加したカタログ資産にデータ保護ルールが適用されます。
  • デプロイメント・スペースは、Watson Machine Learning サービスによって提供されます。
    • 資産は分析プロジェクトとデプロイメント・スペースの間で簡単に移動できます。

クイック・リンク

統合サービス

表 1. 補足サービス
サービス 機能
IBM Analytics Engine 分析ジョブおよび機械学習ジョブを実行するための軽量な専用 Apache Spark クラスターを自動的に起動します。
表 2. 関連サービス
サービス 機能
Cognos Dashboard Embedded プロジェクトで高度な視覚化を使用して、データ内のパターンを識別し、タイムリーかつ効果的な意思決定を行うことができます。
Watson KnowledgeCatalog データ・ガバナンス・フレームワークによってサポートされる、このセキュアなエンタープライズ・カタログ管理プラットフォームを使用して、キュレートされた資産のカタログを作成します。
Watson Machine Learning 幅広いツールを使用して、機械学習モデルを構築、トレーニング、およびデプロイします。

互換性のあるデータ・ソース

互換性のあるデータ・ソース・サービスのリストについては、接続タイプを参照してください。