IBM Match 360 関数 (マッチングなど) で使用する前に、各データ・ソースまたは資産をマップしてデータ・モデルに公開する必要があります。
- 必要な権限
- データ資産をマスター・データ・インスタンスに追加、マップ、および公開するには、 IBM Match 360 サービスの DataEngineer ユーザー・グループのメンバーである必要があります。
- 管理対象カタログで作業している場合、自分がデータ資産所有者であるカタログ資産のみを表示または追加できます。
IBM Match 360 には強力な自動マッピング機能が備わっているため、データ・エンジニアがデータの各列をモデルに手動でマップする必要はありません。 自動マッピング機能は、データの各列を検出、分析し、データ・モデル内の対応する属性またはフィールドに分類します。 自動マッピングを実行する前に、データのプロファイルを作成する必要があります。 プロファイルの作成により、データが分析および分類され、自動マッピング・プロセスを実行できるようになります。
プロファイル作成と自動マッピングは、個人レコード・タイプと組織レコード・タイプに対してのみサポートされます。 その他のタイプのレコードの場合は、手動で列をデータ・モデルにマップします。
このトピックでは、
- フラット・データ・ファイルからのレコード・データの追加
- プロジェクトを介したデータまたはソースの追加
- データ・モデルへのデータのマッピング
- データ資産へのマッピング・パターンの適用
- フラット・データ・ファイルからの関係データの追加
- サンプル・データの公開
フラット・データ・ファイルからのレコード・データの追加
CSV または TSV データ・ファイルから IBM Match 360 にレコード・データを追加するには、以下のように行います。
マスターデータのナビゲーションメニューから、資産アイコン「」をクリックする。
アクションバーで、[データを追加] または [アセットをプロジェクトにアップロード] アイコン ' をクリックします。
開いた「データ」パネルから、アップロードでデータを追加するか、プロジェクトから追加するか、カタログから追加するかを選択します。 データ・ファイルをアップロードするには、「ロード」を選択します。
ローカル・コンピューターで、CSV 形式または TSV 形式のフラット・データ・ファイルを選択し、「データ」パネルにドラッグします。 ファイルのアップロードが完了すると、資産要約リストに追加されます。
アセット]タブで、アセットサマリーテーブルを使用して、新しく追加したアセットとシステム内の他のデータアセットの詳細を確認します。
資産の内容 列に情報がない場合は、特定のレコード タイプなど、資産に含まれるデータのタイプを定義する必要があります。 IBM Match 360 がデータに最も適したデータ モデルの部分を見つけられるように、各アセットに正しいコンテンツ タイプを割り当てることが重要です。 アセットコンテンツタイプが定義されていないアセットには、アセットデータタイプがありませんというステータスがあります。 コンテンツタイプを定義せずにアセットをマッピングすることはできません。
アセットのコンテンツタイプを定義するには、レコードの アセットのコンテンツ 列のドロップダウンリストから選択します。 アセットのステータスがマッピング準備完了に変わります。
適切なデータ型がアセットコンテンツリストにない場合は、データモデルをカスタマイズする必要があるかもしれません。 詳しくは、 データ・モデルのカスタマイズを参照してください。
次のステップ: データ・モデルへのデータのマップ
プロジェクトを介したデータまたはソースの追加
プロジェクトを介して、データ資産、ソース、または接続を IBM Match 360 に追加することができます。
IBM Match 360 を、接続されたデータ・ソースまたはターゲットとして使用できます。 IBM Match 360 接続のセットアップと使用については、 IBM Match 360 接続を参照してください。
IBM Match 360 にロードするデータ資産ファイルには、サポートされるタイプ ( .csv
や .tsv
など) のファイル拡張子を含める必要があります。 この要件には、プロジェクトに既に存在する資産が含まれます。 プロジェクト内の資産名にサポートされるファイル拡張子が含まれていない場合、追加しようとするとグレー表示されます。 プロジェクト内の資産の名前を編集するには、プロジェクトの 「資産」 タブに移動し、資産を選択して、 「この資産について」 パネルで名前を編集します。
このビデオを視聴して、接続を作成し、接続データをプロジェクトに追加する方法を確認してください。
このビデオは、本書の概念とタスクを学習するためのビジュアル・メソッドを提供します。
動画のトランスクリプト 時刻 トランスクリプト 00:00 このビデオでは、データソースへの接続を設定し、接続されたデータをプロジェクトに追加する方法を紹介します。 00:08 データ・ソースにデータが保存されている場合は、任意のプロジェクトからそのデータ・ソースへの接続をセットアップできます。 00:16 ここから、さまざまな要素をプロジェクトに追加できます。 00:20 この場合は、接続を追加したいです。 00:24 IBM サービス ( IBM Db2 および Cloud Object Storageなど)、またはサード・パーティー (Amazon、Microsoft、 Apacheなど) のサービスへの新規接続を作成できます。 00:39 また、互換性のあるサービスに基づいてリストをフィルタリングできます。 00:45 また、プラットフォーム・レベルで作成された接続を追加することもできます。これは、プロジェクトおよびカタログ間で使用できます。 00:54 または、プロビジョンされた IBM Cloud サービスの 1 つへの接続を作成できます。 00:59 この場合は、 Db2 Warehouse on Cloud用のプロビジョンされた IBM Cloud サービスを選択します。 01:08 資格情報が事前設定されていない場合は、 IBM Cloud サービス起動ページからインスタンスの資格情報を取得できます。 01:17 最初に接続をテストしてから、接続を作成します。 01:25 新しい接続がデータ資産のリストに表示されます。 01:30 次に、接続されたデータ資産をこのプロジェクトに追加します。 01:37 ソースを選択します。この場合は、先ほど作成した Db2 Warehouse on Cloud 接続です。 01:43 次に、スキーマと表を選択します。 01:50 これにより、この接続内のデータへの参照が追加され、それがターゲット・プロジェクトに含まれるようになることが分かると思います。 01:58 名前と説明を提供し、「Create」をクリックします。 02:06 このデータ資産のリストにデータが表示されます。 02:09 データ・セットを開いてプレビューを表示します。ここから、データの精製に直接進むことができます。 02:17 Cloud Pak for Data as a Service の資料には他にもビデオがあります。
プロジェクトにデータを直接追加する方法について詳しくは、『プロジェクトへのデータの追加』を参照してください。
データを追加した後、そのデータを IBM Match 360 データ・モデルにマップする必要があります。 詳しくは、 データ・モデルへのデータのマップを参照してください。
データ・モデルへのデータのマッピング
IBM Match 360で使用するデータ資産を公開する前に、それをマップする必要があります。 アセットの各カラムは、対応するデータモデル属性にマッピングされるか、除外されなければなりません。
データ資産をマップするには、いくつかのオプションがあります。
- 各列を手動でマップできます。
- プロファイリングやオートマッピングの助けを借りて、各カラムをマッピングすることができる。
- マッピング・パターンを適用できます。
覚えておいてください: IBM Match 360 のプロファイリングおよびオートマッピング機能を使用するには、IBM Cloud Pak for Data のデプロイメントに IBM Knowledge Catalog が含まれている必要があります。
手動マッピングまたはオートマッピングの詳細については、以下の手順をお読みください。 マッピング・パターンの適用について詳しくは、 データ資産へのマッピング・パターンの適用を参照してください。
データ資産を IBM Match 360 データ・モデルにマップするには、以下のようにします。
資産の概要画面で、マッピングタブをクリックする。
「アセット」リストから、システムにマップするデータ・アセットをクリックします。
お探しのアセットを見つけるために、アセット名で検索したり、列数、レコードタイプ、マッピングステータス、パブリッシングステータス、利用可能なマッピングパターンに基づいてフィルタリングすることができます。 フィルターアイコン「」をクリックしてフィルターを適用する。
選択した資産のデータが表形式で表示され、いくつかの行と列が表示されます。 各列は、データ・モデル内の対応する属性タイプにマップする必要がある属性を表します。 最初にデータ・ソースまたは資産を開いたときに、各列にマップされていないタグのマークが付けられます。
ヒント: 必要に応じて各列を手動でマップすることができますが、自動マッピング機能を利用することにより、マッピング・プロセスを大幅に高速化することができます。マッピングの詳細パネルで、このアセットのマッピング統計を確認します。 一目で、この資産からマッピングされたデータ列があれば、その数を確認できます。
このソースまたは資産の自動マッピングを有効にするには、最初にデータのプロファイルを作成する必要があります。 プロフィールデータをクリックします。
プロファイルの作成により、データが分析および分類され、自動マッピング・プロセスを実行できるようになります。 プロファイル作成は完了までに時間がかかる場合があるため、作業を続行できるようにバックグラウンドで実行されます。 いくつかの列の確認と手動マッピングを開始してください。
自動マップによって手動マッピングが上書きされることはありません。
プロファイリングが完了したら、Automap assetをクリックします。 IBM Match 360 with Watson が、データを分析し、できるだけ多くの列を自動的にデータ・モデルにマップします。 特定の列をマップできない場合でも、自動マップ機能は、最も可能性の高いマッピング選択の一部を提案することができます。
自動マッピングの結果を確認します。 正しくないマッピングがある場合や列がマップされていないままである場合は、手動で正しくマップします。 また、特定の列が必要ない場合は、列の除外を選択して、IBM Match 360 に読み込まれないようにすることもできます。
手動で列をマップするには、その列を選択し、 マッピング・ターゲットパネルを使用してデータ・モデルから適切な属性またはフィールドを検索して選択します。 「マップしてデータ・モデルに保存」をクリックします。
適切な属性またはフィールドがデータ・モデルに存在しない場合は、マッピング・ターゲット」パネルから作成できます。 New > Create attributeまたはNew > Create fieldのいずれかをクリックして、新しい属性またはフィールドの詳細を定義し、提供します。
既存の属性タイプを割り当てる代わりに 単純属性 を作成することを選択した場合、新しい単純属性は 「モデリング」 タブのレコード・タイプに直接追加されます。 「属性タイプ」の下には分類されません。
列を水平方向にスクロールして、データ・ソースまたは資産内のすべての列がマップされていることを確認します。 マップされていない列、自動マップされていない列、またはマッピングから明示的に除外されている列がある場合、データ資産はマッピングが進行中状態のままになります。
IBM Match 360 にロードされる列を除外するには、列を選択し、Exclude column を選択します。
重要:
record_source
属性が資産内のいずれかのフィールドにマップされている場合、そのフィールドは資産のすべてのレコードに取り込まれている必要があります。record_source
フィールドの値が欠落しているレコードがある場合、資産を正常にロードできません。record_source
属性を既存のフィールドにマップしない場合は、資産名を使用してデフォルトのレコード・ソース名が導出されます。データ資産のマッピングが完了したら、データをシステムに公開することができます。
- データモデルが新しいか変更されている場合は、まずアクションバーのモデル公開アイコン「」をクリックしてモデルを公開します。 公開ジョブが完了するまで待ちます。
- データを公開するには、アクションバーのデータ公開アイコン「」をクリックします。 公開ジョブが完了するまで待ちます。
ナビゲーション・メニューから「構成の概要」を選択して、「構成の概要」ページに戻ります。
「構成の概要」ページで、少なくとも 1 つのデータ・ソースまたは資産が追加およびマップされていることを確認します。
データ資産へのマッピング・パターンの適用
マッピング・パターンは、互換性のある資産に対してデータ・マッピングの選択を簡単に繰り返すことができるようにすることで、類似したデータ資産間の整合性を維持するのに役立ちます。
データ資産を手動でマップすると、マッピング・パターンが自動的に作成されます。 このパターンは、列マッピングの選択内容を保存して、同じ列フォーマットとレコード・タイプを共有する他のデータ資産で再利用できるようにします。 マッピング・パターンを適用することにより、既にマップした既存の資産に類似したデータ資産を手動でマッピングしないようにすることができます。
IBM Match 360 は、新規資産がシステム内の既存のマッピング・パターンと互換性があるかどうかを識別し、手動マッピング作業を回避するためにパターンを使用できることを通知します。
マッピング・パターンは、データ資産を手動でマッピングすることによって作成することも、構成スナップショットを使用してインポートすることもできます。
構成スナップショットを使用したマッピング・パターンの管理および適用については、 構成スナップショットの保存およびロードを参照してください。
マップされたデータ資産またはマップ解除されたデータ資産にマッピング・パターンを適用するには、以下のようにします。
資産の概要画面で、マッピングタブをクリックする。
「資産」リストから、マッピング・パターンを適用する 1 つ以上のデータ資産を見つけます。
お探しのアセットを見つけやすくするために、名前による検索や、列数、レコードタイプ、マッピングステータス、パブリッシングステータス、利用可能なマッピングパターンに基づくフィルタリングが可能です。 フィルターアイコン「」をクリックしてフィルターを適用する。
マッピング・パターンを適用するデータ資産を選択します。
- マッピングパターンを1つのデータ資産に適用するには、資産名の横にあるマッピングパターンの適用アイコン「」をクリックします。
- 1 つ以上のデータ資産にマッピング・パターンを適用するには、資産名の横にあるチェック・ボックスを選択し、「資産」リストで 「マッピングの適用」 をクリックします。 マッピング・パターンを共有できるようにするには、選択したデータ資産が同じ構造と列形式を共有している必要があります。
「マッピング・パターンの適用」ページに、使用可能なマッピング・パターンのリストが表示されます。 このアセットに推奨されるマッチングパターンがある場合は、その横にバッジアイコン「」が表示されます。
マッピング・パターンを確認します。 マッピング・パターンが現在適用されている他の資産を、該当するレコード・タイプ、最終更新日、および元のソースとともに確認できます。
詳細を確認し、マッピング・パターンを相互に比較するには、1 次マッピング・パターンを選択してから、 「マッピング・パターンの比較」をクリックします。 パターンを水平方向にスクロールして、選択したパターンと比較します。 ページを縦方向にスクロールして、スナップショットの詳細や列マッピングなどの詳細を表示します。
選択したデータ資産に適用するマッピング・パターンを選択し、 「次へ」をクリックします。
選択したマッピングの変更を確認します。 正しい資産とマッピング・パターンを選択したことを確認します。
マッピング・パターンを適用すると、資産のレコード・タイプが変更される可能性があります。 レコード・タイプを誤って変更しないように注意してください。 マッピング・パターンの適用によって行われたマッピング変更は、資産を手動で再マップせずに元に戻すことはできません。
「終了」 をクリックして、マッピング・パターンを適用します。
マッピング・パターンを適用すると、データをシステムに公開する準備が整います。
- データモデルが新しいか変更されている場合は、まずアクションバーのモデル公開アイコン「」をクリックしてモデルを公開します。 公開ジョブが完了するまで待ちます。
- データを公開するには、アクションバーのデータ公開アイコン「」をクリックします。 公開ジョブが完了するまで待ちます。
フラット・データ・ファイルからの関係データの追加
関係データ資産を IBM Match 360にロードするには、まず対応する関係タイプをデータ・モデルに定義する必要があります。 詳しくは、 データ・モデルのカスタマイズを参照してください。
関係データ資産は、区切り文字で区切られた行 (CSV または TSV) にフォーマット設定されます。 いくつかの必須データ列があります。
- 各関係の両方のパーティーのレコード ID
- 各関係における両方のパーティーのレコード・タイプ
- 各関係の両方のパーティーのレコード・ソース
関係データ資産は、ETL プロセスを使用して手動で作成することも、関係が保管されているアプリケーションを使用して作成することもできます。
CSV データ・ファイルまたは TSV データ・ファイルから IBM Match 360 に関係データを追加するには、以下のようにします。
マスターデータのナビゲーションメニューから、資産アイコン「」をクリックする。
レコード・データ資産を IBM Match 360にロード、マップ、および公開します。 これらのデータ資産には、関係を使用して関連付けるレコード・データが含まれている必要があります。 詳しくは、 フラット・データ・ファイルからのレコード・データの追加 および データ・モデルへのデータのマッピングを参照してください。
リレーションシップ・データ資産ファイルをロードします。
a. アクションバーで、[データを追加] または [アセットをプロジェクトにアップロード] アイコン ' をクリックします。
b. 開いた「データ」パネルから、アップロードでデータを追加するか、プロジェクトから追加するか、カタログから追加するかを選択します。 データ・ファイルをアップロードするには、「ロード」を選択します。
注: データに管理対象カタログが含まれている場合、一部のカタログ資産を表示または追加できない可能性があります。 権限によっては、自分が所有または管理しているカタログ資産のみを表示できる場合があります。c. ローカル・コンピューターで、CSV または TSV 形式の関係データを含むフラット・データ・ファイルを選択し、「データ」パネルにドラッグします。 ファイルのアップロードが完了すると、資産要約リストに追加されます。
新しく追加した関係資産の詳細を確認します。
アセット要約リスト内の関係アセットの行の上にカーソルを移動し、3 点オーバーフロー・メニューをクリックします。
「資産プロパティーの設定」をクリックします。
「資産データ・カテゴリー」 リストから 「関係」 を選択します。
「資産データ・タイプ」 リストから正しい関係タイプを選択し、 「保存」をクリックします。
適切な関係タイプが資産データ・タイプ・リストにない場合は、データ・モデルをカスタマイズする必要があります。 詳しくは、 データ・モデルのカスタマイズを参照してください。
関係データ資産をマップして公開します。 詳しくは、 データ・モデルへのデータのマッピングを参照してください。 必ず、
from record ID
、to record ID
、from record type
、to record type
、from record source
、およびto record source
の各必須データ列をマップしてください。制約事項: 関係データはプロファイル作成と自動マッピングをサポートしません。 列をデータ・モデルに手動でマップします。
サンプル・データの公開
独自のデータ資産を使用する準備ができていないが、 IBM Match 360 サービスの使用を開始する場合は、代わりに、提供されているサンプル・データとモデルをロードしてください。
IBM Match 360 サンプル・データをロードするには、以下のようにします。
- マスター・データのホーム・ページに移動します。
- 「マスター・データ」タイルから、「サンプル・モデルの公開」をクリックします。
- サンプル・モデルの公開が完了したら、「サンプル・データの公開」をクリックします。
- オプションとして、ジョブページでサンプルロードジョブの進行状況を確認することができます。 進行状況を監視したくない場合は、別の画面に移動すると、ジョブはバックグラウンドで作業を続行します。
次のステップ
もっと見る
親トピック: マスター・データの構成