Vous pouvez combiner des tables provenant de plusieurs sources de données en une seule table virtuelle, afin de créer une définition unifiée qui contient les colonnes et les données de toutes les sources de données participantes. Ces tables sont appelées les tables groupées.
La segmentation est verticale (un sous-ensemble ou un sur-ensemble de colonnes basé sur une sélection de colonnes choisies). Vous pouvez exécuter des requêtes sur la table virtuelle résultante de la même manière que vous le feriez sur n'importe quelle table de base.
Les tables peuvent être regroupées en une seule table virtualisée si les noms des tables résolus par le pilote sont identiques (correspondance exacte, sensible à la casse). La sémantique de regroupement des tables considère que les colonnes ayant le même nom (insensible à la casse) correspondent. La promotion de type de données suit les règles de priorité.
Vous devez vous assurer que le regroupement des tables est logique, notamment en ce qui concerne la gestion des types de données de la table groupée des résultats. Dans certains cas, les colonnes qui correspondent peuvent avoir des types de données différents. Les règles sont utilisées pour déterminer les types de données de résultat de la table groupée. Pour plus d'informations, voir Règles pour les types de données de résultat.
Pour éviter des résultats inattendus, vous devez faire attention lorsque vous regroupez des tables dans une seule table virtualisée. Les recommandations suivantes peuvent être prises en compte lors de la création d'une table groupée, bien que rien ne soit restreint.
- Assurez-vous que les colonnes portant le même nom dans toutes les tables ont des types de données et une utilisation commerciale compatibles. Le domaine des données dans toutes les tables doit être compatible.
- Regroupez les tables provenant du même type de source de données pour garantir une sémantique cohérente des données.
- Lorsque vous regroupez des tables provenant de différents types de sources de données, assurez-vous que la sémantique des données est cohérente.
- Vérifiez que toutes les tables du groupe ont la plupart des colonnes avec les mêmes noms. Vérifiez que les colonnes correspondantes disposent de types de données compatibles.
- N'incluez pas les colonnes qui sont définies sur des types complexes.
Remarque: Certaines sources de données, telles que Hive, utilisent des minuscules par défaut pour les noms de table. Ces tables ne peuvent pas être regroupées avec des tables provenant d'autres sources de données dont le nom par défaut est en majuscules, à moins que des identifiants délimités ne soient utilisés pour garantir une correspondance exacte des noms de table.
A propos de cette tâche
Ces étapes décrivent comment virtualiser les données sans les termes métier. Si vous souhaitez gérer vos données virtuelles, voir Gestion des données virtuelles dans la Data Virtualization.
Procédure
- Dans le menu de navigation, cliquez sur .
Le menu de service s'ouvre sur la page Sources de données par défaut.
- Dans le menu du service, cliquez sur et cliquez sur l'onglet Tables .
La liste des connexions s'affiche dans la vue Explorer par défaut. Cliquez sur une connexion, un schéma ou une table pour la sélectionner et prévisualiser le contenu.
La liste des tables disponibles dans vos connexions apparaît dans la vue Liste. Vous pouvez filtrer les tables répertoriées en ajoutant des filtres sur la page Sources de données . En outre, vous pouvez rechercher des tables par nom, schéma, colonne ou terme métier.
La Data Virtualization peut automatiquement suggérer des tables correspondantes qui peuvent être combinées en une seule table virtuelle.
- Pour combiner des tables en un seul objet virtuel, cliquez sur Paramètres et sélectionnez Regrouper les tables portant des noms identiques dans le menu des paramètres.
L'écran affiche le regroupement suggéré des tables et vous pouvez affiner les tables source participantes à l'étape Révision.
La liste des tables disponibles inclut des tables dans lesquelles le droit d'accès en lecture n'est pas accordé (tables non lisibles).
- Si vous créez une table virtuelle incluant une table non lisible, sélectionnez l'une des options suivantes pour rendre votre table virtuelle interrogeable.
- Option 1 Cliquez sur Editer les tables groupées dans le menu d'action de la table et supprimez la table non lisible du groupe que vous virtualisez.
- Option 2 Vérifiez que l'utilisateur affecté à la connexion de source de données peut accéder à la table non lisible. Cette étape peut se produire avant ou après la virtualisation de la table.
- Option 3 Créer une connexion à la source de données dans la Data Virtualization pour accéder à la même source de données avec les informations d'identification d'un utilisateur distinct qui a accès à la table en lecture. Par conséquent, la liste des instances de table supplémentaires apparaît lorsque vous sélectionnez l'option Regrouper des tables avec des noms identiques. Avant de virtualiser les tables, vous devez toujours retirer manuellement les tables non lisibles détectées sous la connexion restreinte de l'utilisateur (comme décrit dans l'option 1).
- Sélectionnez la table à virtualiser et cliquez sur Ajouter au panier.
- Cliquez sur Afficher le panier pour afficher vos sélections. Dans cette fenêtre, vous pouvez également éditer les noms de table et de schéma ou supprimer une sélection de votre panier.
- Sélectionnez l'action appropriée pour affecter la table virtualisée.
Affecter à |
Quand utiliser cette option |
Project |
Sélectionnez Projet si vous avez créé la table virtuelle à utiliser dans un projet spécifique. Choisissez ensuite le projet approprié. La table apparaît également dans Données virtualisées. |
Données virtualisées |
Sélectionnez Données virtualisées si la table n'a pas été créée pour être utilisée dans un projet spécifique. Ce paramètre est la valeur par défaut s'il n'existe aucun projet. |
- Sélectionnez Publier dans le catalogue si vous souhaitez également publier dans un catalogue sélectionné.
La liste des catalogues disponibles s'affiche dans le menu déroulant. Chaque catalogue est marqué comme
Gouverné ou
Non gouverné.
Remarque : vous devez avoir au moins un catalogue dans
IBM Knowledge CatalogVous devez disposer du droit de publication dans un catalogue. Un administrateur peut activer si tous les objets virtuels sont publiés dans un catalogue gouverné sélectionné, ce qui empêche un utilisateur de publier dans un catalogue spécifié.
- Indiquez un schéma dans la zone Schéma .
Vous pouvez également créer un schéma en suivant ces étapes.
- Si vous avez le rôle d'ingénieur en Data Virtualization ou d'utilisateur, laissez le champ Schéma par défaut pour créer un schéma avec votre ID utilisateur.
- Si vous avez le rôle de gestionnaire de la Data Virtualization, laissez le champ Schéma par défaut pour créer un schéma avec votre ID utilisateur ou entrez le nouveau nom du schéma dans le champ Schéma.
- Cliquez sur Virtualiser pour terminer le processus.
Lorsque
la fenêtre de statut s'ouvre, vous pouvez choisir d'afficher vos données virtualisées
ou de virtualiser d'autres données.
- Cliquez sur Afficher les données virtualisées pour afficher les tables que vous venez de créer.