IBM Match 360 接続を使用して、エンティティー・データ、レコード・データ、および関係データをデータ資産、カタログ、および DataStage フローに接続します。
接続されたデータを使用して、 IBM Match 360 with Watson サービスに取り込む前にデータを変換、精製、または分析することができます。あるいは、 IBM Match 360 からマスター・データをエクスポートして、絞り込み、分析、視覚化、およびガバナンスを行うことができます。
IBM Match 360 接続の作成について詳しくは、 IBM Match 360 接続を参照してください。
次のビデオを視聴して、 IBM Match 360 と接続されたデータベースの間でマスター・データをロードおよびエクスポートする方法を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
IBM Match 360 接続の使用
以下のワークスペースおよびツールで、接続された IBM Match 360 データを使用できます。
プロジェクト
- DataStage (DataStage サービス)。 DataStageでのデータ・ソースへの接続を参照してください。
カタログ
- Platform assets catalog
- その他のカタログ (IBM Knowledge Catalog)
管理対象カタログで作業している場合、自分がデータ資産所有者であるカタログ資産のみを表示または追加できます。
IBM Match 360 接続データ・シナリオの例
以下のセクションでは、マスター・データを接続するためのいくつかの一般的なシナリオを実現する方法について詳しく説明します。
- DataStage およびデータベース接続を使用した IBM Match 360 へのデータのインポート
- DataStage および IBM Match 360 接続を使用したマスター・データのエクスポート
- Cloud Pak for Data の資産およびカタログで使用される接続済みマスター・データ資産のエクスポート
DataStage およびデータベース接続を使用した IBM Match 360 へのデータのインポート
このタスクを行うには、以下を行っておく必要があります。
- 有効なソース・データベースとその接続資格情報
- 完全にセットアップされた稼働中の IBM Match 360 サービス・インスタンス
- DataStage
DataStage およびデータベース接続を使用して IBM Match 360 にデータをインポートするには、以下のようにします。
接続資産を作成します。
- ソース・データベース接続: Cloud Pak for Data でサポートされる任意の接続を使用した、ソース・データベースへの接続
- ターゲット接続: IBM Match 360 接続
- 書き込みモード: データを一括でロードする (ロード) か、継続的に小さなチャンクでロードする (進行中の同期) かを定義します。 継続的な同期オプションは、デルタ・ロードのシナリオで役立ちます。
これらの接続の作成について詳しくは、 コネクター とそのサブトピックを参照してください。
DataStage フローをセットアップして、データを IBM Match 360に移動します。 例: [ソース・データベース接続] node-> COPY stage-> [IBM Match 360 connection] node。
3 つのノードすべてをリンクします。
接続、スキーマ名、表名などのソース・プロパティーをセットアップします。
移動するデータ列を選択します。
a. ソース・データベース・ノードの詳細パネルで、 「編集」 > 「データのインポート」をクリックし、 IBM Match 360に移動する列を選択します。 オプションで、列のサブセットを選択できます。
b. すべての LONGVARCHAR データ・タイプについて、それらを VARCHAR データ・タイプに変更し、長さを 200 に変更します。
c. 「適用」をクリックします。
列を IBM Match 360 データ・モデルにマップします。
a. COPY ステージを選択します。
b. 「入力」タブに移動し、前のステップで選択した列がリストされていることを確認します。
c. 「出力」タブに移動し、 「編集」をクリックします。
d. 現在のデータ列名を IBM Match 360 データ・モデルにマップします。
- すべての出力列を選択して削除します。 「データのインポート」をクリックし、 IBM Match 360 接続内から対応するデータ列を見つけます。
- 「インポート」 をクリックして変更を保存します。
- 「出力」タブに戻り、もう一度 「編集」 をクリックし、
Map from input column
列を使用して IBM Match 360 列名をソース列名にマップします。 - 「適用して戻る」をクリックします。
ターゲット・プロパティーをセットアップします。
a. IBM Match 360 接続タブをクリックします。
b. IBM Match 360 接続を選択してから、データ・カテゴリー、データ・タイプ (レコード・タイプ)、およびエンティティー・タイプ (
record
、person
、person_record
など) を定義します。 IBM Match 360 データ・モデルと完全に一致する名前を使用してください。c. 保存 をクリックします。
DataStage フローを保存、コンパイル、および実行します。 成功通知が表示されると、データは IBM Match 360 にロードされ、マッチングの準備が整います。
DataStage および IBM Match 360 接続を使用したマスター・データのエクスポート
このタスクを行うには、以下を行っておく必要があります。
- 有効なソース・データベースとその接続資格情報
- 完全にセットアップされた稼働中の IBM Match 360 サービス・インスタンス
- DataStage
DataStage および IBM Match 360 接続を使用してマスター・データをエクスポートするには、以下のようにします。
接続資産を作成します。
- ソース接続: IBM Match 360 接続
- ターゲット・データベース接続: Cloud Pak for Data
- エクスポート・ジョブ ID (オプション): データの抽出元となる、完了した IBM Match 360 エクスポート・ジョブのジョブ ID。 このフィールドに値が指定されている場合、他の入力フィールドは無視され、サービスは指定されたエクスポート ID に関連付けられたデータをエクスポートします。
- フィルター・ルール (オプション): エクスポートに含めるレコードまたはエンティティー・データを定義する JSON 形式の検索基準。 フィルター・ルールが指定されていない場合、すべてのデータがエクスポートされます。 フィルター・ルールには、ネストされた式の組み合わせを含めることができます。 各式には、プロパティー、条件、および値が含まれています。 例えば、以下の JSON ペイロードを使用して、個人用 E メールの値を含むレコードまたはエンティティー・データをエクスポートするフィルターを定義します。 また、 名が
S
で始まるか、 姓がM
で始まる法人名を定義します。 さらに、includeDeletes
フラグで定義されているように、このエクスポート例には、定義された最終更新日 (entity_last_updated
) より後に削除されたエンティティー・データに関する情報が含まれています。
{ "query": { "expressions": [ { "operation": "or", "expressions": [ { "property": "legal_name.given_name", "condition": "starts_with", "value": "S" }, { "property": "legal_name.last_name", "condition": "starts_with", "value": "M" } ] }, { "property": "personal_email.email_id", "condition": "has_value", "value": null }, { "property": "entity_last_updated", "condition": "greater_than_equal", "value": "0", "expressions": [] } ], "operation": "and" }, "includeDeletes": true }
これらの接続の作成について詳しくは、 コネクター とそのサブトピックを参照してください。
DataStage フロー ([IBM Match 360 接続] ノード-> [ターゲット・データベース接続] ノードなど) をセットアップします。 インポート・フローの場合とは異なり、データ列のマッピングは必要ないため、COPY ステージは必要ありません。
ソース・プロパティーをセットアップします。
a. IBM Match 360 接続ノードを選択します。
b. 「ステージ」 タブで、 IBM Match 360 データベース・プロパティーを構成し、エクスポートするデータのデータ・カテゴリー、データ・タイプ (レコード・タイプ)、およびエンティティー・タイプ (
record
、person
、person_record
など) を、 IBM Match 360 データ・モデルと完全に一致する名前を使用して定義します。c. 保存 をクリックします。 「出力」 タブで、移動する列を参照して選択します。 IBM Match 360 接続を選択し、データ・モデルから必要なデータを選択します。
ターゲット・プロパティーをセットアップします。
a. ターゲット・データベース・ノードで、挿入、更新、またはマージなど、データをデータベースに適用する方法を定義します。 次に、スキーマ名と表名を定義します。
b. 保存 をクリックします。
DataStage フローを保存、コンパイル、および実行します。 成功通知が表示されると、データはターゲット・データベースにロードされます。
Cloud Pak for Data の資産およびカタログで使用するための接続済みマスター・データ資産のエクスポート
このタスクを行うには、以下を行っておく必要があります。
- 完全にセットアップされた稼働中の IBM Match 360 サービス・インスタンス。
Cloud Pak for Data の資産およびカタログで使用するマスター・データ資産をエクスポートするには、以下のようにします。
IBM Match 360 接続を作成します。
a. 「プロジェクト」 > 「資産」 アクション・バーで、 「新規資産」>「データ・ソースへの接続」をクリックします。
b. IBM Match 360 接続を選択します。
c. この接続の説明に名前を付け、接続先の IBM Match 360 サービス・インスタンスの残りの接続の詳細を指定します。 接続の作成について詳しくは、 IBM Match 360 接続を参照してください。
IBM Match 360 接続データ資産を作成します。
a. 「プロジェクト」 > 「資産」 アクション・バーで、 「資産のインポート」>「接続データ」をクリックします。
c. 「ソースの選択」をクリックし、使用可能なデータベースから接続ソースを選択します。
d. IBM Match 360 接続を選択してから、この接続されたデータ資産に含めるデータ・モデルからデータを選択します。
e. 接続済みデータ資産の名前と説明を指定し、 「作成」をクリックします。 これで、プロジェクトの 「資産」 タブに新しい接続済みデータ資産が表示されます。
データ資産をカタログに公開します。
a. プロジェクトの「資産」タブで、データ資産を見つけ、資産のオーバーフロー・メニューから 「カタログに公開」 を選択します。
b. 公開先のカタログを選択し、ジョブに説明を指定し、重複アクションの動作とプライバシーを構成します。
c. オプションで、データの編成と検索に役立つタグを追加し、 「公開」をクリックします。 これで、データがカタログで使用可能になります。 カタログ資産の操作について詳しくは、 カタログの関連付けを参照してください。
もっと見る
親トピック: マスター・データの構成