クイック・スタート: データを仮想化する

Watson Query を使用して、1 つ以上の表のデータをセグメント化または結合する仮想表を作成できます。 Watson Query は、複数のデータ・ソースをデータ・ソースまたはデータベースの単一のセルフ・バランス・コレクションに接続します。 Watson 照会ツールについて読み、ビデオを見て、データの仮想化に関する知識はあるがコーディングは必要ないユーザーに適したチュートリアルを学習します。

必須サービス Watson 照会

基本的なワークフローには、以下のタスクが含まれます:

  1. サービスをプロビジョンし、サービス資格情報を作成します。
  2. 複数のデータ・ソースにデータベースを作成し、データベースの詳細と資格情報を収集します。
  3. データ・ソースに接続を追加します。
  4. すべてのデータ・ソースからのデータを結合して、仮想オブジェクトを作成します。
  5. 仮想オブジェクトへのアクセスを管理します。
  6. 仮想化されたデータをカタログおよびプロジェクトに追加します。
  7. IBM Db2 Data Management Consoleを使用してサービス・インスタンスをモニターします。

Watson 照会について読む

Watson 照会サービスを使用すると、複数のデータ・ソースへの接続、仮想資産の作成と管理、および仮想化データの取り込みを行うことができます。

Watson Query の詳細を読む

Watson Query に関するビデオを見る

ビデオを見る このビデオを見て、 Watson 照会サービスを使用してプロジェクトまたはカタログにデータを仮想化する方法を確認してください。

このビデオでは、本書に記載されている手順に従う代わりの方法として、視覚方式を提供します。

データを仮想化するチュートリアルを試す

このチュートリアルでは、以下を行います。

  • プロジェクトを作成する
  • Watson 照会サービスと Db2 on Cloud サービスをプロビジョンします。
  • Db2 on Cloud サービス・インスタンスにデータをロードします。
  • データ・ソースへ接続を追加します。
  • 単一のデータ・ソースから仮想表を作成します。
  • 仮想化データをカタログまたはプロジェクトに公開します。

このチュートリアルを完了するための所要時間は約 30 分です。

ステップ 1: プロジェクトを作成する

{: #step1} 仮想化データを保管するためのプロジェクトが必要です。

  1. 既存のプロジェクトがある場合は、それを開きます。 既存のプロジェクトがない場合は、ホーム・ページで プロジェクトの作成 をクリックするか、 プロジェクト ページで 新規プロジェクト をクリックします。
  2. 「空のプロジェクトの作成」を選択します。
  3. プロジェクトの作成 画面で、プロジェクトの名前と説明 (オプション) を追加してください。
  4. 既存の オブジェクト・ストレージ・サービス・インスタンス {: new_window} を選択するか、新規作成します。
  5. 「作成」をクリックします。

詳細について、またはビデオを見るには、 プロジェクトの作成 {: new_window}を参照してください。

ステップ 2: サービスをプロビジョンする

{: #step2}このチュートリアルには、 Watson Query サービスと Db2 サービスが必要です。

  1. ナビゲーション・メニューから、 サービス > サービス・インスタンスをクリックしててください。
  2. Watson 照会 サービスがリストされている場合は、別のインスタンスをプロビジョンする必要はありません。 そうでない場合は、以下のステップに従ってください。
    1. 「サービスの追加」をクリックします。
    2. Watson 照会を選択してください。
    3. Watson 照会の ライト プランを選択してください。
    4. 「作成」をクリックします。
  3. Db2 on Cloud サービスまたは Db2 Warehouse on Cloud サービスがリストされている場合は、別のインスタンスをプロビジョンする必要はありません。 そうでない場合は、以下のステップに従ってください。
    1. 「サービスの追加」をクリックします。
    2. Db2を選択してください。
    3. Db2 on Cloudの ライト プランを選択してください。
    4. 「作成」をクリックします。
  4. サービス・インスタンス ページでサービスがプロビジョンされていることを確認します。
  5. Db2 on Cloud (または Db2 Warehouse on Cloud) インスタンス・メニューにアクセスし、 IBM Cloud での管理を選択します。 これにより、 IBM Cloudでサービス・インスタンス・ページが起動します。
  6. 「サービス資格情報」をクリックします。
  7. 資格情報がリストされていない場合は、以下のステップを実行します:
    1. 「新規資格情報」をクリックします。
    2. 「追加」をクリックします。
  8. サービス資格情報を展開し、クリップボードにコピーします。 これらの資格情報は後で接続を構成するために必要になるため、資格情報をテキスト・ファイルに保存することができます。

詳しくは、 Cloud Pak for Data as a Service 上の Db2 {: new_window} および Cloud Pak for Data as a Service に対する Watson 照会 {: new_window}を参照してください。

ステップ 3: Db2 on Cloud へデータをロードする

{: #step3}このチュートリアルで使用するデータ・セットは、ギャラリーで使用できます。 これらのデータ・セットを Db2 on Cloudにロードする必要があります。

  1. IBM Cloudの Db2 on Cloud (または Db2 Warehouse on Cloud) サービス・インスタンス・ページから、 管理 パネルを選択してください。
  2. UI に移動をクリックしてください。 Db2 on Cloud コンソールが表示されます。
  3. データ パネルを選択してください。
  4. ギャラリー内の以下の 2 つのデータ・セットにアクセスし、ローカル・マシンにダウンロードします:
  5. customers.csv ファイルをローカル・マシンから Db2 on Cloud コンソールの データのロード パネルにドラッグし、 次へをクリックしてください。
  6. スキーマを選択します。
  7. 新規テーブル +をクリックし、表名の customers と入力して、 作成をクリックしてください。
  8. 「次へ」をクリックして先に進みます。
  9. ロードするデータを確認し、 次へをクリックしてください。
  10. まとめを確認し、 ロード開始をクリックしてください。
  11. ロードが成功したら、 さらにデータをロードをクリックしてください。
  12. ステップ 5 から 10 を繰り返して、 sales.csv データ・セットを表名 sales で同じスキーマにロードします。

ステップ 4: Db2 on Cloud インスタンスへ接続を追加する

{: #step4} データを仮想化する前に、データ・ソースへの接続を作成する必要があります。

  1. Cloud Pak for Data as a Service にスイッチバックします。
  2. メイン・ナビゲーション・メニューから、 データ > データ仮想化を選択してください。 構成された データ・ソース のリストが表示されます。
  3. 接続の追加 > 新規接続をクリックしてください。
  4. Db2 on Cloud (または Db2 Warehouse on Cloud) を選択してください。
  5. 「選択」をクリックします。
  6. IBM Cloudでインスタンス用にコピーした資格情報に基づいて、接続の詳細を入力します。
  7. 「テスト (Test)」をクリックします。
  8. 「作成」をクリックします。

詳しくは、 Watson Query でのデータ・ソースの追加および接続 {: new_window}を参照してください。

ステップ 5: 仮想化データに表を追加する

{: #step5}接続が定義されていると、そのデータ・ソースからのデータを仮想化できます。

  1. データ・ソース メニューから、 Virtualization > Virtualizeを選択し、使用可能な表がロードされるのを待ちます。
  2. リストから 顧客 表と 営業 表を見つけて選択し、 カートに追加をクリックしてください。
  3. カートの表示をクリックしてください。
  4. これら 2 つの表を仮想化データのリストに追加するには、 仮想化データ を選択してください。
  5. 仮想化をクリックしてください。
  6. 「続行」をクリックします。
  7. 仮想化データの表示をクリックしてください。

詳しくは、 Watson Query での仮想オブジェクトの作成 {: new_window}を参照してください。

ステップ 6: 仮想化データをカタログおよびプロジェクトに公開する

{: #step6} 次に、2 つの表を結合して仮想化資産を作成し、それをカタログとプロジェクトに公開します。

  1. 仮想化データ 画面で、リストから 顧客 表と 営業 表を選択し、 参加をクリックしてください。
  2. 表ごとに、 salesrep を検索します。
  3. 2 つの表の SALESREP_ID 列に接続します。
  4. 「次へ」をクリックする。
  5. 結合された表を確認し、 次へをクリックしてください。
  6. ビュー名の場合、joined_customers_sales_tableと入力します。
  7. リストからプロジェクトを選択します。
  8. カタログに公開 オプションにチェックして、カタログを選択します。
  9. 「ビューの作成」をクリックします。
  10. プロセスが完了したら、プロジェクトまたはカタログを閲覧して、仮想化データをプレビューできます。 プロジェクトまたはカタログ内のデータを表示するには、 IBM Cloud API キーが必要です。 IBM Cloud API キーの作成 {: new_window}を参照してください。

詳しくは、 Watson Query での仮想データの管理を参照してください。

次のステップ

これで、仮想データを使用する準備ができました。 例えば、以下のいずれかのタスクを実行できます:

追加リソース

  • 詳しくは、 ビデオを参照してください。
  • ギャラリー {: new_window}でサンプル・データ・セットを見つけます。
  • この追加チュートリアルを試すと、 Watson Query のハンズオン・エクスペリエンスが向上します: IBM Cloud Pak for Data上の Data Virtualization 外部リンク (external link).

親トピック: 準備するデータで開始