Chargement et accès à des données dans un bloc-notes

Retourner à la version anglaise de la documentation

Dernière mise à jour : 21 nov. 2024

Chargement et accès à des données dans un bloc-notes

Vous pouvez intégrer des données dans des blocs-notes en accédant aux données à partir d'un fichier local, d'ensembles de données gratuits ou d'une connexion de source de données. Vous chargez ces données dans une structure de données ou un conteneur dans le bloc-notes, par exemple, un pandas.DataFrame, numpy.array, un Spark RDD ou un Spark DataFrame.

Pour utiliser des données dans un bloc-notes, vous pouvez choisir entre les options suivantes:

Méthodes recommandées pour l'ajout de données à votre bloc-notes
Option	Méthode recommandée	Exigences	Détails
Ajouter des données à partir d'un fichier sur votre système local	Ajoutez un fragment de code qui charge vos données	Le fichier doit exister en tant qu'actif dans votre projet	Ajoutez un fichier à partir de votre système local , puis utilisez un fragment de code pour charger les données
Ajouter des données à partir d'un jeu de données gratuit à partir du concentrateur de ressources	Ajoutez un fragment de code qui charge vos données	L'ensemble de données (fichier) doit exister en tant qu'actif dans votre projet	Ajoutez un jeu de données gratuit à partir du concentrateur de ressources , puis utilisez un fragment de code pour charger les données
Chargement de données à partir de connexions de source de données	Ajoutez un fragment de code qui charge vos données	La connexion doit exister en tant qu'actif dans votre projet	Ajoutez une connexion à votre projet , puis ajoutez un fragment de code qui charge les données à partir de votre connexion de source de données
Accès aux actifs de projet et aux métadonnées à l'aide d'un programme	Utiliser `ibm-watson-studio-lib`	L'actif de données doit exister dans votre projet	Utilisation de la bibliothèque `ibm-watson-studio-lib` pour interagir avec des actifs de données
Créer et utiliser des données de magasin de fonctions	Utiliser les fonctions de la bibliothèque `assetframe-lib`	L'actif de données doit exister dans votre projet	Utilisation de la bibliothèque `assetframe-lib` pour Python pour créer et utiliser des données de magasin de fonctions
Accès aux données à l'aide d'une fonction API ou d'une commande de système d'exploitation	Par exemple, utilisez : `wget`	Non disponible	Accès aux données à l'aide d'une fonction d'API ou d'une commande de système d'exploitation

Important: assurez-vous que l'environnement dans lequel le bloc-notes est démarré dispose de suffisamment de mémoire pour stocker les données que vous chargez dans le bloc-notes. L'environnement doit disposer d'une quantité de mémoire nettement supérieure à la taille totale des données chargées dans le bloc-notes. Certaines infrastructures de données, comme les pandas, peuvent contenir plusieurs copies des données en mémoire.

Ajout d'un fichier à partir de votre système local

Pour ajouter un fichier de votre système local à votre projet à l'aide de l'éditeur de bloc-notes Jupyterlab:

Ouvrez votre bloc-notes en mode édition.
Dans la barre d'outils, cliquez sur l'icône Télécharger l'actif dans le projet et ajoutez votre fichier.

Astuce: Vous pouvez également faire glisser le fichier dans la barre latérale de votre bloc-notes.

Charger des ensembles de données à partir du concentrateur de ressources

Les fichiers du concentrateur de ressources contiennent des données ouvertes. Regardez cette courte vidéo pour voir comment utiliser les ensembles de données publics dans le concentrateur de ressources.

Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.

Pour ajouter un ensemble de données du concentrateur de ressources à votre projet:

Dans le menu de navigation, sélectionnez Centre de ressources.
Recherchez la carte correspondant au fichier que vous souhaitez ajouter.
Cliquez sur Ajouter au projet, sélectionnez le projet, puis cliquez sur Ajouter. Cliquez sur Afficher le projet pour vous rendre à la page de présentation du projet. L'actif de données est ajouté à la liste des actifs de données de la page Actifs du projet.

Chargement de données à partir de fichiers

Prérequis Le fichier doit exister en tant qu'actif dans votre projet. Pour plus de détails, voir Ajout d'un fichier à partir de votre système local ou Chargement d'un ensemble de données à partir du concentrateur de ressources.

Pour charger des données d'un fichier de projet dans votre bloc-notes:

Ouvrez votre bloc-notes en mode édition.
Cliquez sur l'icône Extraits de code , cliquez sur Lire les données, puis sélectionnez le fichier de données de votre projet. Si vous souhaitez modifier votre sélection, utilisez l'icône Editer .
Dans la liste déroulante Charger en tant que , sélectionnez l'option de chargement de votre choix. Si vous sélectionnez Données d'identification, seules les données d'identification d'accès au fichier seront générées. Pour plus de détails, voir Ajout de données d'identification.
Cliquez dans une cellule de code vide dans votre bloc-notes, puis cliquez sur Insérer du code dans la cellule pour insérer le code généré. Vous pouvez également cliquer pour copier le code généré dans le presse-papiers, puis le coller dans votre bloc-notes.

Le code généré sert de démarrage rapide pour commencer à utiliser un ensemble de données. Pour les systèmes de production, examinez attentivement le code inséré pour déterminer s'il convient d'écrire votre propre code qui répond mieux à vos besoins.

Pour savoir quelles structures de données sont générées pour quel langage de bloc-notes et quel format de données, voir Prise en charge du chargement de données.

Chargement de données à partir de connexions de sources de données

Prérequis Pour pouvoir charger des données à partir d'un service de données IBM ou d'une source de données externe, vous devez créer ou ajouter une connexion à votre projet. Voir Ajout de connexions à des projets.

Pour charger des données à partir d'une connexion de source de données existante dans une structure de données dans votre bloc-notes :

Ouvrez votre bloc-notes en mode édition.
Cliquez sur l'icône Extraits de code , cliquez sur Lire les données, puis sélectionnez la connexion à la source de données de votre projet.
Sélectionnez le schéma et choisissez une table. Si vous souhaitez modifier votre sélection, utilisez l'icône Editer .
Sélectionnez l'option de chargement. Si vous sélectionnez Données d'identification, seules les métadonnées seront générées. Pour plus de détails, voir Ajout de données d'identification.
Cliquez dans une cellule de code vide dans votre bloc-notes, puis insérez du code dans la cellule. Vous pouvez également cliquer pour copier le code généré dans le presse-papiers, puis le coller dans votre bloc-notes.
Si nécessaire, saisissez vos informations d'identification personnelles pour les connexions de données verrouillées qui sont marquées par l'icône Clé Il s'agit d'une étape ponctuelle qui déverrouille définitivement la connexion pour vous. Une fois que vous avez déverrouillé la connexion, l'icône de clé n'apparaît plus. Pour plus d'informations, voir Ajout de connexions à des projets.

Le code généré sert de démarrage rapide pour commencer à utiliser une connexion. Pour les systèmes de production, examinez attentivement le code inséré pour déterminer s'il convient d'écrire votre propre code qui répond mieux à vos besoins.

Pour savoir quelles structures de données sont générées pour quel langage de bloc-notes et quel format de données, voir Prise en charge du chargement de données.

Ajout de données d'identification

Vous pouvez générer votre propre code pour accéder au fichier situé dans votre IBM Cloud Object Storage ou à un fichier accessible via une connexion. Cela est utile lorsque, par exemple, votre format de fichier n'est pas pris en charge par l'outil de génération de fragment. Avec les données d'identification, vous pouvez écrire votre propre code pour charger les données dans une structure de données dans une cellule de bloc-notes.

Pour ajouter les données d'identification:

Cliquez sur l'icône Extraits de code , puis sur Lire les données.
Cliquez dans une cellule de code vide de votre bloc-notes, sélectionnez Données d'identification comme option de chargement, puis chargez les données d'identification dans la cellule. Vous pouvez également cliquer pour copier les données d'identification dans le presse-papiers, puis les coller dans votre bloc-notes.
Insérez vos données d'identification dans le code de votre bloc-notes pour accéder aux données. Par exemple, consultez ce code dans un article de blog pour Python.

Utilisez une fonction d'API ou une commande de système d'exploitation pour accéder aux données

Vous pouvez utiliser des fonctions d'API ou des commandes de système d'exploitation dans votre bloc-notes pour accéder aux données, par exemple, la commande wget pour accéder aux données à l'aide des protocoles HTTP, HTTPS ou FTP. Lorsque vous utilisez ces types de fonctions et de commandes d'API, vous devez inclure le code qui définit le jeton d'accès au projet. Voir Ajoutez manuellement le jeton d'accès au projet.

Pour obtenir des informations de référence sur l'API, voir l'API du tronc commun de données et d'IA.

Rubrique parent: Blocs-notes et scripts