0 / 0
資料の 英語版 に戻る
データ統合チュートリアル: データの統合

データ統合チュートリアル: データの統合

このチュートリアルでは、データ・ファブリック試用版のデータ統合ユース・ケースを使用して、3 つの外部データ・ソースに保管されているデータを変換します。 目標は、 DataStage を使用してデータを変換し、その変換されたデータを単一の出力ファイルにデリバーすることです。 「外部データの仮想化 (Virtualize external data)」 チュートリアルを完了した場合は、 Data Virtualization を使用して、このチュートリアルで DataStageを使用した場合と同じ多くのタスクを実行しました。

クイック・スタート: このチュートリアル用のサンプル・プロジェクトをまだ作成していない場合は、リソース・ハブの データ統合サンプル・プロジェクト にアクセスします。

このチュートリアルでは、ゴールデン・バンクは、適格性を満たしていないローン申請者には融資できないという新しい規制を遵守する必要があると説明しています。 ゴールデン・バンクのデータ・エンジニアは現在、 DataStage を使用して、匿名化された住宅ローン申請データを住宅ローン申請者の個人情報と集約します。 貸し手はこの情報を使用して、住宅ローン申請を承認するか拒否するかを決定できます。 あなたのリーダーシップは、各クレジット・スコア範囲の借り手に提示する毎日の利率を計算するリスク・アナリストを追加しました。 貸し手と共有するスプレッドシートにこの情報を統合する必要があります。 スプレッドシートには、各申請者のクレジット・スコア情報、申請者の総負債、および金利ルックアップ・テーブルが含まれます。 最後に、データをターゲット出力 CSV ファイルにロードします。

以下のアニメーション・イメージは、このチュートリアルを終了するまでに実行する内容のクイック・プレビューを提供します。 DataStage を使用して、申請者とアプリケーション・データを結合し、状態でフィルタリングし、申請者のクレジット・スコアを結合し、総負債を計算し、クレジット・スコア範囲に基づいてオファーする住宅ローン金利を検索し、結果を CSV ファイルに出力します。 イメージをクリックすると、より大きなイメージが表示されます。

アニメーション化されたイメージ

チュートリアルをプレビューする

このチュートリアルでは、以下のタスクを実行します:

ビデオを見る このチュートリアルのステップをプレビューするには、このビデオをご覧ください。 ビデオに表示されるユーザー・インターフェースには若干の違いがある場合があります。 このビデオは、作成されたチュートリアルと一緒に使用することを目的としています。

このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。





このチュートリアルを完了するためのヒントこのチュートリアルを正常に完了するためのヒントを以下に示します。

ビデオ・ピクチャー・イン・ピクチャーの使用

ヒント: ビデオを開始してから、チュートリアルをスクロールすると、ビデオはピクチャー・イン・ピクチャー・モードに移行します。 ピクチャー・イン・ピクチャーを最大限に活用するには、ビデオの目次を閉じます。 ピクチャー・イン・ピクチャー・モードを使用して、このチュートリアルのタスクを完了する際にビデオをフォローすることができます。 後続の各タスクのタイム・スタンプをクリックします。

以下のアニメーション・イメージは、ビデオ・ピクチャー・イン・ピクチャーおよび目次機能の使用方法を示しています。

ピクト・イン・ピクチャーおよび章の使用法

コミュニティーでのヘルプの利用

このチュートリアルでヘルプが必要な場合は、 Cloud Pak for Data コミュニティー・ディスカッション・フォーラムで質問したり、回答を見つけたりすることができます。

ブラウザー・ウィンドウのセットアップ

このチュートリアルを最適に実行するには、1 つのブラウザー・ウィンドウで Cloud Pak for Data を開き、このチュートリアル・ページを別のブラウザー・ウィンドウで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。 2 つのブラウザー・ウィンドウを横並びに配置して、見やすくすることを検討してください。

横並びのチュートリアルと UI

ヒント: ユーザー・インターフェースでこのチュートリアルを実行しているときにガイド・ツアーが表示された場合は、 「後で行うこともあります」をクリックします。



前提条件のセットアップ

前提条件

Cloud Pak for Data as a Service への登録

Cloud Pak for Data as a Service に登録し、データ統合ユース・ケースに必要なサービスをプロビジョンする必要があります。

  • 既存の Cloud Pak for Data as a Service アカウントがある場合は、このチュートリアルを開始できます。 ライト・プランのアカウントを持っている場合、このチュートリアルを実行できるのはアカウントごとに 1 人のユーザーのみです。
  • Cloud Pak for Data as a Service アカウントがまだない場合は、 データ・ファブリックのトライアルに登録してください。

ビデオ・アイコン 以下のビデオを視聴して、 Cloud Pak for Dataのデータ・ファブリックについて確認してください。

このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。

必要なプロビジョン済みサービスの確認

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 01:09から始まるビデオをご覧ください。

重要: DataStage サービスは、ダラスとフランクフルトのリージョンでのみ使用可能です。 必要に応じて、続行する前にダラスまたはフランクフルト地域に切り替えてください。

必要なサービスを検証またはプロビジョンするには、以下の手順を実行します。

  1. Cloud Pak for Dataで、ダラスまたはフランクフルトの地域にいることを確認します。 そうでない場合は、地域ドロップダウンをクリックして、 「ダラス」 または 「フランクフルト」を選択します。
    リージョンの変更

  2. Cloud Pak for Data のナビゲーション・メニュー ナビゲーション・メニューから、 「サービス」>「サービス・インスタンス」を選択します。

  3. 「製品」 ドロップダウン・リストを使用して、 DataStage サービス・インスタンスが存在するかどうかを判別します。

  4. DataStage サービス・インスタンスを作成する必要がある場合は、 サービスの追加をクリックしてください。

  5. DataStageを選択してください。

    1. 地域として、 「ダラス」 または 「フランクフルト」を選択します。

    2. 「ライト」 プランを選択します。

    3. 「作成」 をクリックします。

  6. これらのステップを繰り返して、以下の追加サービスを確認またはプロビジョニングします:

    • IBM Knowledge Catalog
    • Cloud Object Storage

チェックポイント・アイコン 進行状況を確認してください

次のイメージは、プロビジョンされたサービス・インスタンスを示しています。

プロビジョンされたサービス

サンプル・プロジェクトを作成する

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 01:44から始まるビデオをご覧ください。

このチュートリアルのサンプル・プロジェクトが既にある場合は、 タスク 1にスキップします。 そうでない場合は、以下のステップに従ってください。

  1. リソース・ハブの データ統合サンプル・プロジェクト にアクセスします。

  2. 「プロジェクトの作成」をクリックします。

  3. プロジェクトを Cloud Object Storage インスタンスに関連付けるように求められたら、リストから Cloud Object Storage インスタンスを選択してください。

  4. 「作成」 をクリックします。

  5. プロジェクトのインポートが完了するまで待ってから、 「新規プロジェクトの表示」 をクリックして、プロジェクトと資産が正常に作成されたことを確認します。

  6. 「資産」 タブをクリックして、接続と DataStage フローを表示します。

注: このユース・ケースに含まれているチュートリアルを示すガイド・ツアーが表示される場合があります。 ガイド・ツアーのリンクから、これらのチュートリアルの説明が開きます。

チェックポイント・アイコン 進行状況を確認してください

以下の画像は、サンプル・プロジェクトの 「資産」 タブを示しています。 これで、チュートリアルを開始する準備ができました。

サンプル・プロジェクト




タスク 1: 既存の DataStage フローの実行

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 02:40から始まるビデオをご覧ください。

住宅ローン申請者と住宅ローン申請データ・セットを結合する基本的な DataStage フローから開始し、その結果をプロジェクト内の CSV ファイルに出力します。 DataStage フローを実行するには、以下の手順を実行します。

  1. 「データ統合」 プロジェクトで開始します。 プロジェクトを開いていない場合は、以下の手順を実行します。

    1. Cloud Pak for Data のナビゲーション・メニュー ナビゲーション・メニューから、 「プロジェクト」>「すべてのプロジェクトを表示」を選択します。

    2. 「データ統合」 プロジェクトを開きます。

  2. 「アセット」 タブをクリックして、プロジェクト内のすべてのアセットを表示します。

  3. 「フロー」> DataStage フロー」をクリックします。

    ヒント: DataStage フローが表示されない場合は、前に戻ってサービス・インスタンスを表示し、正常にプロビジョンされた DataStage インスタンスを確認してください。 必要なサービスのプロビジョンを参照してください。
  4. リスト内の 「データ統合」 フローをクリックして開きます。 このフローは、 Db2 Warehouseに保管されている 「住宅ローン申請者」 表と 「住宅ローン申請者」 表を結合し、カリフォルニア州のレコードにデータをフィルタリングし、出力として CSV 形式の順次ファイルを作成します。

  5. ツールバーの 「ズームイン」 アイコン ズームイン および 「ズームアウト」 アイコン ズームアウト をクリックして、キャンバスの優先ビューを設定します。

  6. MORTGAGE_APPLICATIONS_1 ノードをダブルクリックして設定を表示します。

    1. プロパティー セクションを展開します。

    2. スクロールダウンしてから、 「データのプレビュー」をクリックします。 このデータ・セットには、住宅ローン・アプリケーションで収集された情報が含まれています。

    3. 「閉じる」をクリックします。

  7. MORTGAGE_APPLICANTS_1 ノードをダブルクリックして設定を表示します。

    1. プロパティー セクションを展開します。

    2. スクロールダウンして、 データのプレビューをクリックしてください。 このデータ・セットには、ローン申請者に関する情報が含まれています。

    3. オプション: データを視覚化します。

      1. 「グラフ」 パネルをクリックします。

      2. 「視覚化する列」 リストで、 「状態」を選択します。

      3. 「データの視覚化 (Visualize data)」 をクリックして、状態別のデータの分布を示す円グラフを表示します。

      4. 同じデータをツリー・マップ・グラフで表示するには、 「ツリー・マップ」 アイコンをクリックします。

    4. 「閉じる」をクリックします。

  8. Join_on_ID ノードをダブルクリックして設定を表示します。

    1. プロパティー セクションを展開します。

    2. 結合キーは ID 列であることに注意してください。
      Join_on_ID 結合キー

    3. 設定を閉じるには、 「キャンセル」 をクリックします。

  9. ツールバーの 「ログ」 アイコン ログの表示 をクリックすると、フローの進行状況を確認できます。

  10. コンパイルをクリックし、次に 実行をクリックしてください。 あるいは、 「実行」 をクリックしてコンパイルし、 DataStage フローを実行することもできます。 実行が完了するまで約 1 分かかります。

  11. ログを表示します。 フロー内の各ステップの合計行数と合計行数/秒を使用して、フィルターが予期したとおりに動作していることを視覚的に確認できます。

  12. 実行が正常に完了したら、ナビゲーション・トレールで 「データ統合」 をクリックしてプロジェクトに戻ります。
    ナビゲーション・トレール

  13. 「アセット」 タブで、 「データ」>「データ・アセット」をクリックします。

  14. MORTGAGE_INTEREST_RATES.CSV ファイルを開きます。 このファイルには、住宅ローン申請者と住宅ローン申請者の両方のデータ・セットの列が含まれていることが分かります。

チェックポイント・アイコン 進行状況を確認してください

以下のイメージは、結果の MORTGAGE_INTEREST_RATES.CSV ファイル。 次のタスクでは、 DataStage フローを編集します。

MORTGAGE_INTEREST_RATES.CSV ファイル




概要: DataStage フローの編集

住宅ローン申請者とアプリケーション・データに参加したので、 DataStage フローを編集して以下を行うことができます。

  • タスク 2: Join ステージのキー列を指定します。
  • タスク 3: PostgreSQL データベースからクレジット・スコア・データを追加します。
  • タスク 4: Join ステージを追加して、クレジット・スコア・データを申請者データおよびアプリケーション・データと結合します。
  • タスク 5: 合計負債を計算するために Transformer ステージを追加します。
  • タスク 6: MongoDB データベースから金利データを追加します。
  • タスク 7: 申請者のクレジット・スコアおよびゴールデン・バンクの日次金利範囲に基づいて金利をルックアップする Lookup ステージを追加します。



タスク 2: Join ステージのキー列を指定する

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 04:33から始まるビデオをご覧ください。

キー列を識別することは、その列に固有値が含まれていることを DataStage に示します。 Join_on_ID ノードは、結合キーの ID 列を使用して、住宅ローン申込者と住宅ローン申込者のデータ・セットを結合します。 次のフェーズでは、結果のデータ・セットをクレジット・スコア・データと結合します。 後で、フィルタリングされた結果のデータをクレジット・スコア・データ・セットと結合します。 2 番目の結合では、結合キーとして EMAIL_ADDRESS 列が使用されます。 このタスクでは、 DataStage フローを編集して、結果データ・セットがクレジット・スコア・データと結合されるときに、結果データ・セットのキー列として EMAIL_ADDRESS 列を指定します。

以下のアニメーション表示イメージは、2 つの結合ノードの説明の代わりにビジュアル表示を提供します。 イメージをクリックすると、より大きなイメージが表示されます。

結合ノード

結合ノードの設定を変更するには、以下の手順を実行します。

  1. ナビゲーション・トレールで 「データ統合」 をクリックして、プロジェクトに戻ります。
    ナビゲーション・トレール

  2. 「資産」 タブで、 「フロー」> DataStage フロー」をクリックします。

  3. 「データ統合」 フローを開きます。

  4. Join_on_ID ノードをダブルクリックして設定を編集します。

  5. 出力 タブをクリックし、 カラム セクションを展開して、結合されたデータ・セット内の列のリストを表示します。

  6. 編集」 をクリックします。

  7. EMAIL_ADDRESS 列名には、 キーを選択してください。

  8. 適用して戻る をクリックして、 Join_on_ID ノード設定に戻ります。

  9. 保存 をクリックして、 Join_on_ID ノード設定を保存します。

チェックポイント・アイコン 進行状況を確認してください

以下の図は、編集された Join_on_id ステージを持つ DataStage フローを示しています。 EMAIL_ADDRESS 列をキー列として識別したので、申込者のクレジット・スコアを含む PostgreSQL データを追加できます。

Join_on_id ステージ




タスク 3: PostgreSQL データベースからのクレジット・スコア・データの追加

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 05:14から始まるビデオをご覧ください。

以下のステップに従って、 PostgreSQL データベースに保管されているクレジット・スコア・データを DataStage フローに追加します。

  1. ノード・パレットで、 コネクター セクションを展開します。

  2. 「資産ブラウザー」 コネクターをキャンバスの MORTGAGE_APPLICANTS_1 ノードの横にドラッグします。

  3. 「接続」> Data Fabric 「試用版」- Databases for PostgreSQL >「BANKING> CREDIT_SCORE」を選択して、資産を見つけます。

    注: チェック・ボックスの代わりに接続名またはスキーマ名をクリックして、接続とスキーマを展開します。

    クレジット・スコア・プレビュー

  4. 「プレビュー」 アイコン 表示 をクリックして、各応募者のクレジット・スコア・データをプレビューします。

  5. 追加 をクリックします。

チェックポイント・アイコン 進行状況を確認してください

以下の画像は、クレジット・スコア資産が追加された DataStage フローを示しています。 これで、クレジット・スコア・データがキャンバスに追加されたので、申請者、アプリケーション、およびクレジット・スコア・データに参加する必要があります。

クレジット・スコア・データ資産




タスク 4: クレジット・スコア・データを応募者およびアプリケーション・データと結合するための Join ステージを追加する

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 05:46から始まるビデオをご覧ください。

以下のステップに従って、別の Join ステージを追加し、フィルタリングされた住宅ローン・アプリケーションおよび住宅ローン申請者の結合データを DataStage フロー内のクレジット・スコア・データと結合します。

  1. ノード・パレットで、 Stages セクションを展開します。

  2. Join ステージをキャンバスにドラッグし、 Filter_State_Code ノードと Sequential_file_1 ノードの間のリンク・ラインにノードをドロップします。

  3. CREDIT_SCORE_1 コネクターの上にカーソルを移動すると、矢印が表示されます。 矢印を Join ステージに接続します。

  4. CREDIT_SCORE_1 ノードをダブルクリックして設定を編集します。

    1. 出力 タブをクリックし、 カラム セクションを展開して、結合されたデータ・セット内の列のリストを表示します。

    2. 編集」 をクリックします。

    3. EMAIL_ADDRESS および CREDIT_SCORE 列名の場合は、 キーを選択してください。

    4. 適用して戻る をクリックして、 CREDIT_SCORE_1 ノード設定に戻ります。

    5. 保存 をクリックして、 CREDIT_SCORE_1 ノード設定を保存します。

  5. Join_1 ノードをダブルクリックして設定を編集します。

    1. プロパティー セクションを展開します。

    2. 「鍵の追加」をクリックします。

      1. 再度 キーの追加 をクリックしてください。

      2. 使用可能なキーのリストから 「EMAIL_ADDRESS」 を選択します。

      3. 「適用」をクリックします。

    3. 適用して戻る をクリックして、 Join_1 ノード設定に戻ります。

    4. Join_1 ノード名を Join_on_emailに変更します。

    5. 保存 をクリックして、 Join_1 ノード設定を保存します。

チェックポイント・アイコン 進行状況を確認してください

次の図は、2 番目の Join ステージが追加された DataStage フローを示しています。 アプリケーション、応募者、およびクレジット・スコアのデータに参加したので、Transformer ステージを追加して、各応募者の負債合計を計算する必要があります。

Join_on_email ステージ




タスク 5: 総負債を計算するための Transformer ステージの追加

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 07:00から始まるビデオをご覧ください。

以下のステップに従って、LOAN_AMOUNT 列とCREDITCARD_済列を合計して新しい列を作成する Transformer ステージを追加します。

  1. 「ステージ」 セクションで、 Transformer ステージをキャンバスにドラッグし、 Join_on_email ノードと Sequential_file_1 ノードの間のリンク行にノードをドロップします。

  2. Transformer ノードをダブルクリックして設定を編集します。

  3. 「出力」 タブをクリックします。

    1. 列の追加をクリックしてください。

    2. 列のリストをスクロールダウンして、新しい列を確認します。

    3. 列に TOTAL_DEBTという名前を付けます。

    4. 行の 「出力仕様」 列で 「編集」 アイコン 編集 をクリックします。

    5. 「導出」 列の 「計算器」 アイコン 計算 をクリックして、式ビルダーを開きます。

    6. LOAN_AMOUNTを検索し、列名をダブルクリックして式に追加します。 リンク番号は列名に付加されることに注意してください。

    7. 正符号 +を入力します。

    8. CREDITCARD_DEBTを検索してから、列名をダブルクリックして式に追加します。 リンク番号は列名に付加されることに注意してください。

    9. 最後の式が Link_5.LOAN_AMOUNT + Link_5.CREDITCARD_DEBTであることを確認します。

      注: リンク番号が異なる場合があります。
    10. 適用して戻る をクリックして、 トランスフォーマー ページに戻ります。

    11. CREDIT_SCORE 列名として 「キー」を選択します。

  4. 保存して戻る をクリックして、キャンバスに戻ります。

チェックポイント・アイコン 進行状況を確認してください

次の図は、Transformer ステージが追加された DataStage フローを示しています。 これで、各応募者の負債総額を計算したので、クレジット・スコアの範囲に基づいてオファーする金利の表を追加する必要があります。

Transformer ステージ




タスク 6: MongoDB データベースからの利率データの追加

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 07:49から始まるビデオをご覧ください。

以下のステップに従って、データ資産コネクターを MongoDB データベースに追加することで、金利をフローに含めます。

  1. ノード・パレットで、 コネクター セクションを展開します。

  2. アセット・ブラウザー コネクターを CREDIT_SCORE_1 ノードの横のキャンバスにドラッグします。

  3. 「接続」> Data Fabric 「試用版-Mongo DB」>「DOCUMENT」>「DS_INTEREST_RATES」を選択して、資産を見つけます。

  4. 「プレビュー」 アイコン プレビュー をクリックして、各クレジット・スコア範囲の金利をプレビューします。
    データ資産の表示
    STARTING_LIMIT 列と ENDING_LIMIT 列の値を使用して、申請者のクレジット・スコアに基づいて適切な利率を調べることができます。 ID 列は不要であるため、次のステップでその列を削除します。

  5. 追加 をクリックします。

チェックポイント・アイコン 進行状況を確認してください

以下のイメージは、 MongoDB 外部ソースから追加された金利データ資産を含む DataStage フローを示しています。 これで金利表が追加されたので、申請者ごとに適切な金利を調べることができます。

金利データ資産




タスク 7: 申込者の利率を検索するための Lookup ステージの追加

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 08:35から始まるビデオをご覧ください。

各応募者のクレジット・スコアに基づいて、適切な利率を調べる必要があります。 以下のステップに従って Lookup ステージを追加し、各金利のクレジット・スコア制限の開始と終了の範囲を指定します。

  1. 「ステージ」 セクションで、 Lookup ステージをキャンバスにドラッグし、 Transformer_1 ノードと Sequential_file_1 ノードの間のリンク・ラインにノードをドロップします。

  2. DS_INTEREST_RATES_1 コネクターを Lookup_1 ステージに接続します。

  3. DS_INTEREST_RATES_1 ノードをダブルクリックして設定を編集します。

  4. 「出力」 タブをクリックします。

    1. カラム セクションを展開し、 編集をクリックしてください。

    2. _ID 列を選択してください。

    3. 「削除」 アイコン ごみ箱 をクリックして、 _ID 列を削除します。

    4. 適用して戻る をクリックして、 DS_INTEREST_RATES_1 ノード設定に戻ります。

    5. 保存 をクリックして、 DS_INTEREST_RATES_1 ノードに対する変更を保存します。

  5. Lookup_1 ノードをダブルクリックして設定を編集します。

  6. プロパティー セクションを展開します。

    1. 列に範囲を適用 フィールドには、 CREDIT_SCOREを選択してください。 「参照リンク」「演算子」、および 「範囲列」 の各フィールドが表示されます。

    2. 参照リンクの場合は、 Link_9を選択してください。

      注: リンク番号が異なる場合があります。
    3. 最初の 「演算子」で、 < =を選択します。

    4. 最初の 範囲列の場合は、 ENDING_LIMITを選択してください。

    5. 2 番目の 「演算子」で、 「> =」を選択します。

    6. 2 番目の 範囲列の場合は、 STARTING_LIMITを選択してください。

  7. 「出力」 タブをクリックします。

    1. カラム セクションを展開し、 編集をクリックしてください。

    2. STARTING_LIMIT 列と ENDING_LIMIT 列を選択します。

    3. これらの不要な STARTING_LIMIT 列および ENDING_LIMIT 列を削除するには、 「削除」 アイコン ごみ箱 をクリックします。

    4. 適用して戻る をクリックして、 Lookup_1 ノード設定に戻ります。

    5. 保存 をクリックして、 Lookup_1 ノードに対する変更を保存します。

チェックポイント・アイコン 進行状況を確認してください

以下の図は、Lookup ステージが追加された DataStage フローを示しています。 これで、 DataStage フローが完了しました。 フローを実行する前の最後のタスクは、出力ファイルの名前を指定することです。

Lookup ステージ




タスク 8: 順次ファイル・ノードを編集し、 DataStage フローを実行する

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 09:56から始まるビデオをご覧ください。

以下のステップに従って順次ファイル・ノードを編集し、最終出力ファイルをデータ資産としてプロジェクトに作成してから、 DataStage フローをコンパイルして実行します。

  1. Sequential_file_1 ノードをダブルクリックして設定を編集します。

  2. 入力 タブをクリックしてください。

  3. プロパティー セクションを展開します。

  4. 「ターゲット・ファイル」では、ファイル名として MORTGAGE_APPLICANTS_INTEREST_RATES.CSV をコピー・アンド・ペーストします。

  5. データ資産の作成を選択してください。

  6. 「最初の行は列名」 フィールドで、 「True」を選択します。

  7. 保存 をクリックします。

  8. 「実行」 をクリックすると、 DataStage フローがコンパイルされて実行されます。 ジョブが完了するまで約 1 分かかります。

  9. ツールバーの 「ログ」 をクリックして、フローの進行状況を監視します。 実行中に警告が表示され、フローが正常に実行されたことが表示されるのは正常です。

チェックポイント・アイコン 進行状況を確認してください

以下の図は、 DataStage フローが正常に実行されたことを示しています。 これで、 DataStage フローが出力ファイルを作成したので、出力ファイルを公開するカタログを作成する必要があります。

DataStage の実行が完了しました




タスク 9: 公開されたデータ資産を保管するためのカタログの作成

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 10:28から始まるビデオをご覧ください。

ゴールデン・バンクの他のデータ・エンジニアやビジネス・アナリストは、住宅ローン金利にアクセスする必要があります。 IBM Knowledge Catalog ライト・プランでは、2 つのカタログを作成できます。 既にカタログがある場合は、このステップをスキップしてください。 それ以外の場合は、以下のステップを実行して、利率データ・セットを公開できるカタログを作成します。

  1. Cloud Pak for Data のナビゲーション・メニュー ナビゲーション・メニューで、 「カタログ」>「すべてのカタログを表示」を選択します。

  2. 「カタログ」 ページに 「住宅ローン承認カタログ」 が表示されている場合は、 「タスク 10: 出力を表示してカタログに公開」にスキップします。 それ以外の場合は、以下の手順に従って新規カタログを作成します。

  3. カタログの作成をクリックしてください。

  4. 「名前」に、表示されているとおりにカタログ名をコピー・アンド・ペーストします。先頭または末尾にスペースは使用しません。

    Mortgage Approval Catalog
    
  5. 「データ保護ルールの適用 (Enforce data protection rules)」を選択し、選択内容を確認して、他のフィールドのデフォルトを受け入れます。

  6. 「作成」 をクリックします。

チェックポイント・アイコン 進行状況を確認してください

以下のイメージは、カタログを示しています。 住宅ローン承認カタログが作成されたので、出力ファイルをカタログに公開することができます。

住宅ローン承認カタログ




タスク 10: 出力を表示してカタログに公開する

プレビュー・チュートリアル・ビデオ このタスクをプレビューするには、 10:57から始まるビデオをご覧ください。

以下のステップに従って、プロジェクト内の出力ファイルを表示し、それをカタログに公開します。

  1. Cloud Pak for Data のナビゲーション・メニュー ナビゲーション・メニューから、 「プロジェクト」>「すべてのプロジェクトを表示」を選択します。

  2. 「データ統合」 プロジェクトを開きます。

  3. 「アセット」 タブで、 「データ」>「データ・アセット」をクリックします。

  4. MORTGAGE_APPLICANTS_INTEREST_RATES.CSV ファイルを開きます。

  5. スクロールすると、統合データ・セット内のすべての列が表示され、各データ項目の終わりに金利が表示されます。

  6. ナビゲーション・トレールで 「データ統合」 をクリックして、プロジェクトに戻ります。

  7. 資産 タブで、 MORTGAGE_APPLICANTS_INTEREST_RATES.CSV ファイルの行の末尾にある オーバーフロー メニュー オーバーフロー・メニュー をクリックし、 カタログに公開を選択します。

    1. リストから 「住宅ローン承認カタログ」 (またはカタログ名) を選択し、 「次へ」をクリックします。

    2. 「公開後にカタログに移動」のオプションを選択し、 「次へ」をクリックします。

    3. アセットを確認し、 「公開」をクリックします。

  8. カタログで、 Mortgageを検索します。

  9. MORTGAGE_APPLICANTS_INTEREST_RATES.CSV ファイルを開きます。

  10. 資産 タブをクリックして、データを表示します。

チェックポイント・アイコン 進行状況を確認してください

次の図は、 MORTGAGE_APPLICANTS_INTEREST_RATES.CSV ファイル。 貸し手が住宅ローンに関する意思決定を行うために必要なデータが使用可能になりました。

MORTGAGE_APPLICANTS_INTEREST_RATES.CSV ファイル



ゴールデン・バンクのデータ・エンジニアとして、住宅ローン申請者、申請、信用格付け、および信用スコアの情報を統合し、そのデータをカタログに公開しました。

クリーンアップ (オプション)

データ統合ユース・ケースのチュートリアルを再利用する場合は、以下の成果物を削除します。

成果物 削除方法
住宅ローン承認カタログ カタログの削除
データ統合サンプル・プロジェクト プロジェクトの削除

次のステップ

もっと見る

親トピック: ユース・ケースのチュートリアル

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細