Une fois que vous avez créé un projet, l'étape suivante consiste à lui ajouter des actifs de données afin de pouvoir utiliser les données. Tous les collaborateurs du projet sont automatiquement autorisés à accéder aux données du projet.
Différents types d'actif peuvent avoir des noms en double. Toutefois, vous ne pouvez pas ajouter plusieurs fois un type d'actif portant le même nom.
Vous pouvez utiliser les méthodes suivantes pour ajouter des actifs de données à des projets:
Méthode | Utilisation |
---|---|
Ajout de fichiers locaux | Vous disposez de données dans des fichiers CSV ou similaires sur votre système local. |
Ajouter des fichiers de concentrateur de ressources | Vous souhaitez utiliser des exemples de jeux de données. |
Ajoutez des connexions à la base de données. | Vous devez vous connecter à une source de données distante. |
Ajouter des données à partir d'une connexion | Vous avez besoin d'une ou de plusieurs tables ou fichiers provenant d'une source de données distante. |
Ajouter une vue dynamique | Vous avez besoin d'une vue qui contient un sous-ensemble des données dans une ou plusieurs tables d'une source de données distante. |
Importation de métadonnées à partir d'une connexion | Vous avez besoin d'un grand nombre de tables ou de fichiers provenant d'une source de données distante. Vous souhaitez planifier et réexécuter le processus d'importation. |
Ajout d'actifs de dossier connectés à partir d' IBM Cloud Object Storage | Vous avez besoin d'un dossier dans IBM Cloud Object Storage qui contient un ensemble dynamique de fichiers, tel qu'un flux de nouvelles. |
Ajouter des actifs de catalogue | Vous avez besoin d'un ou de plusieurs actifs d'un catalogue. |
Convertir des fichiers dans le stockage de projet en actifs | Vous souhaitez convertir les fichiers que vous avez créés dans le projet en actifs de données. |
Ajout de fichiers locaux
Vous pouvez ajouter un fichier à partir de votre système local en tant qu'actif de données dans un projet.
- Autorisations requises
Vous devez avoir le rôle Éditeur ou Administrateur dans le projet.
- Restrictions
- Le fichier ne peut pas être vide.
- Le nom de fichier ne peut pas dépasser 255 caractères.
- La taille maximale des fichiers que vous pouvez charger avec l'interface utilisateur est de 5 Go. Vous pouvez charger des fichiers plus volumineux dans un projet à l'aide des API.
Pour ajouter des fichiers de données à un projet :
Dans la page Actifs de votre projet, cliquez sur l'icône Télécharger l'actif dans le projet . Vous pouvez également cliquer sur la même icône à partir d'un bloc-notes ou d'un canevas.
Dans le panneau qui s'ouvre, recherchez les fichiers ou faites-les glisser dans le panneau. Vous devez rester sur la page jusqu'à ce que le chargement soit terminé.
Les fichiers sont enregistrés dans la mémoire d'objets associée à votre projet et sont répertoriés en tant qu'actifs de données sur la page Actifs de votre projet.
Lorsque vous cliquez sur le nom de l'actif de données, vous pouvez afficher les informations suivantes sur les actifs de données à partir de fichiers :
- Le nom et la description de l'actif
- Les balises de l'actif
- Le nom de la personne qui a créé l'actif
- La taille des données
- La date à laquelle l'actif a été ajouté au projet
- La date à laquelle l'actif a été modifié pour la dernière fois
- Aperçu des données, pour les fichiers CSV, Avro, Parquet, TSV, Microsoft Excel, PDF, texte, JSON et image
- Un profil des données, pour les fichiers CSV, Avro, Parquet, TSV et Microsoft Excel
Vous pouvez modifier le contenu d'un actif de données d'un fichier en ajoutant au projet un fichier de mêmes nom et format puis en choisissant de remplacer l'actif de données existant.
Vous pouvez supprimer l'actif de données en sélectionnant l'option Supprimer dans le menu d'action en regard du nom de l'actif. Choisissez l'option Préparer les données pour affiner les données avec Data Refinery.
Ajouter des ensembles de données de concentrateur de ressources
Vous pouvez ajouter des ensembles de données du concentrateur de ressources à votre projet:
- Dans le concentrateur de ressources, recherchez la carte de l'ensemble de données que vous souhaitez ajouter.
- Cliquez sur l'icône Ajouter au projet dans la barre d'actions, sélectionnez le projet, puis cliquez sur Ajouter.
Regardez cette courte vidéo pour voir comment charger et analyser des jeux de données publics.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Retranscription de la vidéo Heure Transcription 00:00 Cette vidéo explique comment accéder aux fichiers publics dans la galerie Cloud Pak for Data as a Service . 00:06 Démarrez dans le concentrateur de ressources et utilisez les filtres pour afficher uniquement les ensembles de données. 00:13 Ici, vous trouverez des jeux de données riches que vous pouvez utiliser dans votre analyse. 00:17 Par exemple, vous pouvez rechercher " économie " ou " population " ou " météo " ou " emploi ". 00:28 Cela ressemble à un ensemble de données intéressant. 00:30 Ouvrez le fichier et prévisualisez les données. 00:34 A partir de là, vous pouvez partager le jeu de données sur les réseaux sociaux, obtenir un lien direct vers le jeu de données ou télécharger le jeu de données. 00:45 Vous pouvez également copier le fichier dans un projet spécifique. 00:52 Maintenant, naviguez jusqu'à ce projet. 00:55 Et dans l'onglet "Actifs", vous verrez que le jeu de données a été ajouté à la section des actifs de données. 01:01 Ensuite, ajoutez un nouveau bloc-notes. 01:05 Le titre de ce bloc-notes sera " Taux de chômage ". 01:09 Sélectionnez un environnement d'exécution et un langage. 01:14 Lorsque vous êtes prêt, créez le bloc-notes. 01:20 Lorsque le bloc-notes se charge, accédez aux sources de données et recherchez le fichier de chômage. 01:27 Cliquez sur " Insérer au code " et choisissez le mode d'insertion des données. 01:33 Les choix de cette liste déroulante dépendent du langage utilisé dans ce bloc-notes. 01:38 Notez que le code inséré inclut les données d'identification dont vous aurez besoin pour lire le fichier de données à partir de l'instance Object Storage. 01:45 Lorsque vous exécutez le code, les cinq premières lignes s'affichent. 01:50 Vous êtes maintenant prêt à commencer à analyser les ensembles de données enrichis du concentrateur de ressources. 01:56 Trouvez d'autres vidéos dans la documentation de Cloud Pak for Data as a Service.
Convertir les fichiers dans le stockage de projet en actifs
Le stockage du projet contient les actifs de données que vous avez téléchargés dans le projet, mais il peut également contenir d'autres fichiers. Par exemple, vous pouvez sauvegarder un DataFrame dans un bloc-notes dans le stockage de l'environnement de projet. Vous pouvez convertir des fichiers dans le stockage de projet en actifs.
Pour convertir des fichiers dans le stockage de projet en actifs:
- Dans l'onglet Actifs de votre projet, cliquez sur Importer un actif.
- Sélectionnez Fichiers de projet.
- Sélectionnez le dossier data_asset .
- Sélectionnez l'actif et cliquez sur Importer.
Etapes suivantes
En savoir plus
Rubrique parent : Préparation des données