Data Virtualizationで複数のデータソースから仮想化テーブルを作成する

最終更新: 2025年3月17日

Data Virtualizationで複数のデータソースから仮想グループ化テーブルを作成する

複数のデータ・ソースのテーブルを1つの仮想テーブルにまとめることができ、参加しているすべてのデータソースの列とデータを含む統一された定義を作成することができます。これらのテーブルは、グループ化されたテーブルと呼ばれています。

セグメンテーションは垂直方向（選択されたカラムの選択に基づいて、カラムのサブセットまたはスーパーセットのいずれか）です。できあがった仮想テーブルに対しては、他の基本テーブルと同じようにクエリを実行できます。

ドライバが解決したテーブルの名前が同じ（完全に一致、大文字と小文字を区別します）であれば、テーブルは1つの仮想化テーブルにグループ化することができます。テーブルのグループ化セマンティクスでは、同じ名前 (大/小文字を区別しない)の列が一致と見なされます。データ・タイプのプロモーションは、優先順位ルールに従います。

テーブルのグループ化が論理的であること、特に結果としてグループ化されたテーブルのデータタイプの取り扱いについては、確実に行わなければなりません。場合によっては、対応する列のデータ・タイプが異なることがあります。ルールは、グループ化されたテーブルの結果データ・タイプを判別するために使用されます。詳しくは、結果データ・タイプの規則を参照してください。

予期しない結果を防ぐため、テーブルを単一の仮想化テーブルにグループ化する場合は注意が必要です。グループ化されたテーブルを作成するときは、何も制限はありませんが、以下の推奨事項を考慮することをお勧めします。

すべてのテーブルの同じ名前の列が、互換性のあるデータ型と互換性のあるビジネス用途を持っていることを確認してください。すべてのテーブルのデータのドメインに互換性があること。
同じタイプのデータ・ソースのテーブルをグループ化することで、一貫性のあるデータ・セマンティクスを実現します。
異なるタイプのデータ・ソースのテーブルをグループ化する場合は、一貫性のあるデータ・セマンティクスを確保してください。
グループ内のすべてのテーブルに、同じ名前の列がほとんどあることを確認してください。一致する列のデータ型に互換性があることを確認してください。
複合タイプに定義された列は含めないでください。

注: Hiveなどの一部のデータ・ソースでは、表名に小文字のデフォルトが使用されます。区切り識別子を使用してテーブル名が完全に一致しない限り、これらのテーブルを、デフォルトとして大文字を持つ他のデータ・ソースのテーブルとグループ化することはできません。

このタスクについて

ここでは、ビジネス用語を使わずにデータを仮想化する方法を説明します。仮想データを管理したい場合は、 Data Virtualization化の仮想データを管理するを参照してください。

手順

ナビゲーションメニューで、「データ」> Data virtualization サービスメニューを表示します。
サービス・メニューは、デフォルトで「データ・ソース」ページを開きます。
サービス・メニューで、以下を実行します。「仮想化」 > 「仮想化」をクリックし、「表」タブをクリックします。

接続のリストがデフォルトの「探索」ビューに表示されます。接続、スキーマ、または表をクリックして選択し、内容をプレビューします。

接続で使用可能な表のリストが「リスト」ビューに表示されます。「データ・ソース」ページでフィルターを追加することにより、リストされた表をフィルターに掛けることができます。また、名前、スキーマ、列、またはビジネス用語で表を検索することもできます。

Data Virtualizationは、1つの仮想テーブルに結合できるマッチしたテーブルを自動的に提案する。
表を単一の仮想オブジェクトに結合するには、「設定」をクリックし、設定メニューで「同じ名前の表をグループ化する」を選択します。

ディスプレイにはテーブルのグループ化の候補が表示され、Reviewステップで参加するソース・テーブルを微調整することができます。

使用可能な表のリストには、読み取り許可が付与されていない表 (読み取り不能な表) が含まれます。
読み取り不能なテーブルを含む仮想テーブルを作成する場合は、以下のいずれかのオプションを選択して、仮想化テーブルを照会可能にします。
- オプション 1 テーブル・アクション・メニューの「グループ化されたテーブルの編集」をクリックして、仮想化するグループから読み取り不能なテーブルを削除します。
- オプション 2 データ・ソース接続に割り当てられているユーザーが、読み取り不能なテーブルにアクセスできるようにします。このステップは、テーブルが仮想化される前でも後でも可能です。
- オプション 3 Data Virtualizationでデータ・ソース接続を作成し、テーブルへの読み取りアクセス権を持つ別のユーザーの資格情報で同じデータ・ソースにアクセスする。この結果、「同じ名前の表をグループ化 (Group tables with identical names)」オプションを選択すると、追加の表インスタンスのリストが表示されるようになります。表を仮想化する前であっても、制限されたユーザーの接続でディスカバーされた読み取り不能な表を手動で削除する必要があります(オプション 1 の説明を参照)。
仮想化する表を選択し、「カートに追加」をクリックします。
選択項目を表示するには、「カートの表示」をクリックします。このウィンドウから、表およびスキーマの名前を編集したり、カートから選択を削除したりすることもできます。
仮想化されたテーブルに適切な共有オプションを選択します。
選択したカタログにも公開する場合は、「カタログに公開」を選択します。
使用可能なカタログのリストがドロップダウン・メニューに表示されます。各カタログには、「ガバナンス対象」または「ガバナンス対象外」のタグが付けられます。
注： IBM Knowledge Catalog に少なくとも1つのカタログを用意する必要があります。
カタログに公開する権限が必要です。管理者は、選択されたガバナンス対象カタログにすべての仮想オブジェクトを公開するかどうかを有効にすることができ、ユーザーが指定されたカタログに公開するのを防ぐことができます。
「スキーマ」フィールドにスキーマを指定します。
以下のステップに従ってスキーマを作成することもできます。
- Data Virtualization EngineerまたはUserのロールがある場合は、 Schemaフィールドをデフォルトのままにして、ユーザーIDでスキーマを作成します。
- Data Virtualization Managerロールがある場合は、 Schemaフィールドをデフォルトのままにしてユーザー ID でスキーマを作成するか、Schemaフィールドに新しいスキーマ名を入力します。
詳しくは、仮想オブジェクトのスキーマの作成を参照してください。
プロセスを完了するには、「仮想化」をクリックします。
状況ウィンドウが表示されたら、仮想化データを表示するか、さらにデータを仮想化するかを選択できます。
新しく作成した表を表示するには、「仮想化データの表示」をクリックします。

次の作業

仮想オブジェクトの統計を収集できます。詳しくは、Data Virtualization での統計の収集を参照してください。
「仮想化データ」ページで、仮想オブジェクトをカタログに公開できます。詳細については、仮想データをカタログに公開する Data Virtualization をご覧ください。
結合ビューを作成する結合複数の仮想表を作成することもできます。複数の表からの結合ビューの作成を参照してください。