接続からプロジェクトへのデータの追加

接続されたデータ資産 は、外部データ・ソースへの接続を介してアクセスされるデータへのポインターです。 接続済みデータ資産を作成するには、接続、任意の中間構造またはパス、およびリレーショナル表またはビュー、一連のパーティション・データ・ファイル、またはファイルを指定します。 接続済みデータ資産にアクセスすると、データはデータ・ソースから動的に取得されます。

特定のリレーショナル表またはビュー、一連のパーティション・データ・ファイル、またはデータ・ソースへの接続を介してアクセスされるファイルに基づいて、接続済みデータ資産を作成します。

また、同じ方法で、接続を介してアクセスされるフォルダー資産を追加することもできます。 プロジェクトへのフォルダー資産の追加を参照してください。

パーティション・データ資産にはプレビューとプロファイルがあり、リレーショナル表のようにマスクできます。 ただし、Data Refinery ツールを使用してパーティション・データ資産のシェーピングおよびクレンジングを行うことはまだできません。

データ資産を接続からプロジェクトに追加するには、次のようにします。

  1. New asset > Connected dataをクリックします。
  2. 既存の接続資産をデータのソースとして選択します。 接続資産持っていない場合は、 New assetに戻り、 Connection および create a connection assetを選択します。
  1. 必要なデータを選択し、 Selectをクリックします。 パーティション化されたデータの場合は、ファイルが含まれているフォルダーを選択します。 ファイルが区分データとして認識されると、 This folder contains a partitioned data set. というメッセージが表示されます

  2. 名前および説明を入力します。
  3. 「作成」をクリックします。 資産がプロジェクトの Assets ページに表示されます。

資産名をクリックすると、接続済み資産に関する以下の情報を確認できます。

  • 資産の名前と説明
  • 資産のタグ
  • 資産を作成したユーザーの名前
  • データのサイズ
  • 資産がプロジェクトに追加された日付
  • 資産の最終変更日
  • リレーショナル・データの プレビューです
  • リレーショナル・データの プロファイルです

このビデオを視聴して、接続を作成し、接続データをプロジェクトに追加する方法を確認してください。

このビデオでは、本書に記載されている手順に従う代わりの方法として、視覚方式を提供します。

  • 時間 トランスクリプト
    00:00 このビデオでは、データ・ソースへの接続をセットアップし、接続されたデータを Watson Studio プロジェクトに追加する方法を示します。
    00:08 データ・ソースにデータが保存されている場合は、任意のプロジェクトからそのデータ・ソースへの接続をセットアップできます。
    00:15 ここから、さまざまな要素をプロジェクトに追加できます。
    00:20 この場合は、接続を追加したいです。
    00:24 IBM サービス ( 例:IBM Db2 や Cloud Object Storageなど) への新規接続も、サード・パーティー (例:Amazon、Microsoft、Apache など) からのサービスへの新規接続も作成できます。
    00:39 また、互換性のあるサービスに基づいてリストをフィルタリングできます。
    00:45 プラットフォーム・レベルで作成された接続を追加することもできます。これは、プロジェクトおよびカタログ間で使用できます。また、プロビジョンされた IBM Cloud サービスの 1 つへの接続を作成することもできます。
    00:59 この場合は、 Db2 Warehouse on Cloud用のプロビジョンされた IBM Cloud サービスを選択します。
    01:09 資格情報が事前設定されていない場合は、 IBM Cloud サービス起動ページからインスタンスの資格情報を取得できます。
    01:18 接続をテストしてから接続を作成します。
    01:27 新しい接続がデータ資産のリストに表示されます。
    01:32 次に、接続されたデータ資産をこのプロジェクトに追加します。
    01:36 ソースを選択します。
    01:39 この場合は、これは先ほど作成した Db2 Warehouse on Cloud 接続です。
    01:44 次に、スキーマと表を選択します。
    01:51 これにより、この接続内のデータへの参照が追加され、それがターゲット・プロジェクトに含まれるようになることが分かると思います。
    01:59 名前と説明を提供し、「Create」をクリックします。
    02:07 このデータ資産のリストにデータが表示されます。
    02:11 データ・セットを開いてプレビューを取得します。
    02:14 ここから、データの絞り込みに直接進むことができます。
    02:19 Cloud Pak for Data as a Service の資料には他にもビデオがあります。

次のステップ

もっと見る

親トピック:

分析プロジェクトへのデータの追加