Démarrage rapide : virtualisation des données

Vous pouvez utiliser Watson Query pour créer un tableau virtuel pour segmenter ou combiner des données à partir d'un ou plusieurs tableaux. Watson Query connecte plusieurs sources de données en une seule collection d'auto-équilibrage de sources de données ou de bases de données. Lisez en davantage à propos de l'outil Watson Query, puis regardez une vidéo et suivez un tutoriel qui convient aux utilisateurs avec une certaine connaissance des données virtualisées, mais pour lequel vous n'avez pas besoin de coder.

Service requis Watson Query

Votre flux de travaux de base inclut les tâches suivantes :

  1. Mise à disposition du service et création de vos données d'identification de service.
  2. Création de bases de données dans plusieurs sources de données et collecte des données d'identification et des détails de base de données.
  3. Ajout de connexions à vos sources de données.
  4. Création d'objets virtuels en combinant des données de toutes vos sources de données.
  5. Gestion de l'accès à vos objets virtuels.
  6. Ajout de données virtualisées à vos catalogues et projets.
  7. Surveillance de votre instance de service avec IBM Db2 Data Management Console.

Lisez au sujet de Watson Query

Avec le service Watson Query, vous pouvez vous connecter à plusieurs sources de données, créer et gérer des actifs virtuels et consommer les données virtualisées.

En savoir plus sur Watson Query

Visionnez une vidéo sur Watson Query

Regardez une vidéo Regardez cette vidéo pour voir comment virtualiser des données dans un projet ou un catalogue à l'aide du service Watson Query.

Cette vidéo constitue une alternative visuelle aux procédures figurant dans cette documentation.

Essayer un tutoriel pour virtualiser des données

Dans ce tutoriel, vous :

  • Créez un projet.
  • Mise à disposition des services Watson Query et Db2 on Cloud.
  • Charger des données dans votre instance de service Db2 on Cloud.
  • Ajout de connexions à une source de données.
  • Création d'une table virtualisée à partir d'une source de données unique.
  • Publication des données virtualisées dans un catalogue ou un projet.

Ce tutoriel dure environ 30 minutes.

Etape 1 : Création d'un projet

{: #step1} Vous avez besoin d'un projet pour stocker les données virtualisées.

  1. Si vous avez un projet existant, ouvrez-le. Si vous ne disposez pas d'un projet existant, cliquez sur Créer un projet sur la page d'accueil ou sur Nouveau projet sur votre page Projets.
  2. Sélectionnez Créer un projet vide.
  3. Dans l'écran Créer un projet , ajoutez un nom et une description facultative pour le projet.
  4. Choisissez une instance de service de stockage d'objets existante ou créez-en une nouvelle.
  5. Cliquez sur Créer.

Pour plus d'informations ou pour regarder une vidéo, voir Création d'un projet.

Etape 2 : Mise à disposition des services

{: #step2}Ce tutoriel nécessite le service Watson Query ainsi qu'un service Db2.

  1. Dans le menu de navigation, cliquez sur Services > Instances de service.
  2. Si un service Watson Query est répertorié, il n'est pas nécessaire de mettre à disposition une autre instance. Dans le cas contraire, procédez comme suit :
    1. Cliquez sur Add service.
    2. Sélectionnez Requête Watson.
    3. Sélectionnez le plan Lite pour Watson Query.
    4. Cliquez sur Créer.
  3. Si un service Db2 on Cloud ou Db2 Warehouse on Cloud est répertorié, il n'est pas nécessaire de mettre à disposition une autre instance. Dans le cas contraire, procédez comme suit :
    1. Cliquez sur Add service.
    2. Sélectionnez Db2.
    3. Sélectionnez le plan Lite pour Db2 on Cloud.
    4. Cliquez sur Créer.
  4. Vérifiez que les services sont mis à disposition sur votre page Instances de service.
  5. Accédez au menu d'instance Db2 on Cloud (ou Db2 Warehouse on Cloud) et sélectionnez Gérer dans IBM Cloud. Cela va lancer la page de l'instance de service dans IBM Cloud.
  6. Cliquez sur Données d'identification pour le service.
  7. Si aucune donnée d'identification n'est répertoriée, procédez comme suit :
    1. Cliquez sur Nouvelles données d'identification.
    2. Cliquez sur Ajouter.
  8. Développez les données d'identification de service, puis copiez-les dans le presse-papiers. Vous aurez besoin de ces données d'identification ultérieurement pour configurer une connexion. Vous pouvez donc sauvegarder les données d'identification dans un fichier texte.

Pour plus d'informations, voir Db2 sous Cloud Pak for Data en tant que service et Watson Query on Cloud Pak for Data en tant que service.

Etape 3 : Chargement des données dans Db2 on Cloud

{: #step3} Les fichiers que vous utiliserez dans ce tutoriel sont disponibles dans la galerie. Vous devez charger ces fichiers dans Db2 on Cloud.

  1. À partir de votre page d'instance de service Db2 on Cloud (ou Db2 Warehouse on Cloud) dans IBM Cloud, sélectionnez le panneau Gérer.
  2. Cliquez sur Accéder à l'interface utilisateur. La console Db2 on Cloud s'affiche.
  3. Sélectionnez le panneau Données.
  4. Accédez à ces deux fichiers dans la galerie, puis téléchargez-les sur votre machine locale :
  5. Faites glisser le fichier Customers.csv de votre machine locale vers le panneau Charger les données de la console Db2 on Cloud, puis cliquez sur Suivant.
  6. Sélectionnez un schéma.
  7. Cliquez sur Nouveau tableau +, entrez customers pour le nom du tableau, puis cliquez sur Créer.
  8. Cliquez sur Next pour continuer.
  9. Passez en revue les données à charger et cliquez sur Suivant.
  10. Passez en revue le récapitulatif et cliquez sur Début de chargement.
  11. Une fois le chargement réussi, cliquez sur Charger plus de données.
  12. Répétez les étapes 5 à 10 pour charger le fichier Sales.csv dans le même schéma avec le nom du tableau sales.

Etape 4 : Ajout d'une connexion à votre instance Db2 on Cloud

{: #step4} Avant de pouvoir virtualiser les données, vous devez créer une connexion à la source de données.

  1. Revenez dans Cloud Pak for Data as a Service.
  2. Dans le menu de navigation principal, sélectionnez Données > Virtualisation des données. La liste des sources de données s'affiche.
  3. Cliquez sur Ajouter une connexion > Nouvelle connexion.
  4. Sélectionnez Db2 on Cloud (ou Db2 Warehouse on Cloud).
  5. Cliquez sur Sélectionner.
  6. Complétez les détails de connexion en fonction des données d'identification que vous avez copiées pour votre instance dans IBM Cloud.
  7. Cliquez sur Test.
  8. Cliquez sur Créer.

Pour plus d'informations, voir Ajout et connexion à des sources de données dans Watson Query.

Etape 5 : Ajout de tables à vos données virtualisées

{: #step5} Avec la connexion définie, vous pouvez virtualiser des données à partir de cette source de données.

  1. Dans le menu Sources de données, sélectionnez Virtualisation > Virtualiser et attendez que les tableaux disponibles soient chargés.
  2. Localisez et sélectionnez les tableaux Clients et Ventes dans la liste, puis cliquez sur Ajouter au panier.
  3. Cliquez sur Voir le panier.
  4. Sélectionnez Données virtualisées pour ajouter ces deux tableaux à votre liste de données virtualisées.
  5. Cliquez sur Virtualiser.
  6. Cliquez sur Continu.
  7. Cliquez sur Afficher les données virtualisées.

Pour plus d'informations, voir Création d'objets virtuels dans Watson Query.

Étape 6 : Publier des données virtualisées dans un catalogue et un projet

{: #step6} Ensuite, joignez deux tableaux pour créer un actif virtualisé et les publier dans un catalogue et un projet.

  1. Dans l'écran Données virtualisées, sélectionnez les tableaux Clients et Ventes dans la liste, puis cliquez sur Joindre.
  2. Pour chaque tableau, recherchez salesrep.
  3. Connectez les colonnes ID_VENDEUR dans les deux tableaux.
  4. Cliquez sur Suivant.
  5. Passez en revue le tableau joint et cliquez sur Suivant.
  6. Pour le nom de la vue, entrez joined_customers_sales_table.
  7. Sélectionnez un projet dans la liste.
  8. Vérifiez l'option Publier dans le catalogue et sélectionnez un catalogue.
  9. Cliquez sur Créer une vue.
  10. Une fois le processus terminé, vous pouvez afficher le projet ou le catalogue pour prévisualiser les données virtualisées. Vous aurez besoin d'une clé d'API IBM Cloud pour afficher les données dans le projet ou le catalogue. Voir Création d'une clé d'API IBM Cloud.

Pour plus d'informations, voir Données virtuelles des données dans la requête Watson.

Etapes suivantes

Vos données virtuelles sont maintenant prêtes à être utilisées. Par exemple, vous pouvez effectuer l'une des tâches suivantes :

Autres ressources

Rubrique parent : Initiation à la préparation des données