Ajout de données d'une connexion à un projet

Un actif de données connecté est un pointeur vers des données accessibles via une connexion à une source de données externe. Vous créez un actif de données connecté en spécifiant une connexion, des structures ou des chemins intermédiaires, une table ou une vue relationnelle, un ensemble de fichiers de données partitionnés ou un fichier. Lorsque vous accédez à un actif de données connecté, les données sont extraites dynamiquement de la source de données.

Vous créez un actif de données connecté en fonction d'une table ou d'une vue relationnelle spécifique, d'un ensemble de fichiers de données partitionnés ou d'un fichier accessible via la connexion à la source de données.

Vous pouvez également ajouter un actif de dossier accessible via une connexion de la même façon. Voir Ajouter un actif de dossier à un projet.

Les actifs de données partitionnées présentent des aperçus et des profils, et peuvent être masqués comme des tables relationnelles. Cependant, vous ne pouvez pas encore définir et nettoyer des actifs de données partitionnées avec l'outil Data Refinery.

Pour ajouter un actif de données à un projet à partir d'une connexion :

  1. Cliquez sur Nouvel actif > Données connectées.
  2. Sélectionnez un actif de connexion existant comme source de données. Si vous ne disposez d'aucun actif de connexion, revenez au nouvel actif et sélectionnez connexion et Créer un actif de connexion.
  1. Sélectionnez les données de votre choix et cliquez sur Sélectionner. Pour les données partitionnées, sélectionnez le dossier contenant les fichiers. Si les fichiers sont reconnus en tant que données partitionnées, le message This folder contains a partitioned data set. s'affiche.

  2. Entrez un nom et une description.
  3. Cliquez sur Créer. L'actif apparaît sur la page Actifs du projet.

Lorsque vous cliquez sur le nom de l'actif, vous pouvez afficher les informations suivantes sur les actifs connectés :

  • Le nom et la description de l'actif
  • Les balises de l'actif
  • Le nom de la personne qui a créé l'actif
  • La taille des données
  • La date à laquelle l'actif a été ajouté au projet
  • La date à laquelle l'actif a été modifié pour la dernière fois
  • Un aperçu des données relationnelles
  • Un profil des données relationnelles

Regardez cette vidéo pour voir comment créer une connexion et ajouter les données connectées à un projet.

Cette vidéo constitue une alternative visuelle aux procédures figurant dans cette documentation.

  • Durée Retranscription
    00:00 Cette vidéo montre comment configurer une connexion à une source de données et ajouter des données connectées à un projet Watson Studio.
    00:08 Si vous disposez de données stockées dans une source de données, vous pouvez configurer une connexion à cette source de données à partir de n'importe quel projet.
    00:15 À partir de là, vous pouvez ajouter différents éléments au projet.
    00:20 Dans ce cas, vous souhaitez ajouter une connexion.
    00:24 Vous pouvez créer une connexion à un service IBM, tel que IBM Db2 et Cloud Object Storage, ou à un service de tiers, tels que Amazon, Microsoft ou Apache.
    00:39 Vous pouvez également filtrer la liste en fonction de services compatibles.
    00:45 Vous pouvez également ajouter une connexion qui a été créée au niveau de la plateforme, qui peut être utilisée dans les projets et les catalogues, ou vous pouvez créer une connexion à l'un de vos services IBM Cloud mis à disposition.
    00:59 Dans ce cas, sélectionnez le service IBM Cloud mis à disposition pour Db2 Warehouse on Cloud.
    01:09 Si les données d'identification ne sont pas préremplies, vous pouvez obtenir les données d'identification de l'instance à partir de la page de lancement du service IBM Cloud.
    01:18 Tout d'abord, testez la connexion, puis créez la connexion.
    01:27 La nouvelle connexion s'affiche désormais dans la liste des actifs de données.
    01:32 Ajoutez ensuite des actifs de données connectés à ce projet.
    01:36 Sélectionnez la source.
    01:39 Dans ce cas, c'est la connexion Db2 Warehouse on Cloud qui vient d'être créée.
    01:44 Sélectionnez ensuite le schéma et le tableau.
    01:51 Vous pouvez voir que cela va ajouter une référence aux données à l'intérieur de cette connexion et l'inclure dans le projet cible.
    01:59 Indiquez un nom et une description et cliquez sur " Créer ".
    02:07 Les données s'affichent désormais dans la liste des actifs de données.
    02:11 Ouvrez le jeu de données pour obtenir un aperçu.
    02:14 Et à partir de ce moment, vous pouvez passer directement à l'affinage des données.
    02:19 Trouvez d'autres vidéos dans la documentation de Cloud Pak for Data as a Service.

Etapes suivantes

En savoir plus

Rubrique parent :

Ajout de données à un projet d'analyse