Vous pouvez intégrer des données dans des blocs-notes en accédant aux données à partir d'un fichier local, d'ensembles de données gratuits ou d'une connexion de source de données. Vous chargez ces données dans une structure de données ou un conteneur dans le bloc-notes, par exemple, un pandas.DataFrame, numpy.array, un Spark RDD ou un Spark DataFrame.
Pour utiliser des données dans un bloc-notes, vous pouvez choisir entre les options suivantes:
Option | Méthode recommandée | Exigences | Détails |
---|---|---|---|
Ajouter des données à partir d'un fichier sur votre système local | Ajoutez un fragment de code qui charge vos données | Le fichier doit exister en tant qu'actif dans votre projet | Ajoutez un fichier à partir de votre système local , puis utilisez un fragment de code pour charger les données |
Ajouter des données à partir d'un jeu de données gratuit à partir du concentrateur de ressources | Ajoutez un fragment de code qui charge vos données | L'ensemble de données (fichier) doit exister en tant qu'actif dans votre projet | Ajoutez un jeu de données gratuit à partir du concentrateur de ressources , puis utilisez un fragment de code pour charger les données |
Chargement de données à partir de connexions de source de données | Ajoutez un fragment de code qui charge vos données | La connexion doit exister en tant qu'actif dans votre projet | Ajoutez une connexion à votre projet , puis ajoutez un fragment de code qui charge les données à partir de votre connexion de source de données |
Accès aux actifs de projet et aux métadonnées à l'aide d'un programme | Utiliser ibm-watson-studio-lib |
L'actif de données doit exister dans votre projet | Utilisation de la bibliothèque ibm-watson-studio-lib pour interagir avec des actifs de données |
Créer et utiliser des données de magasin de fonctions | Utiliser les fonctions de la bibliothèque assetframe-lib |
L'actif de données doit exister dans votre projet | Utilisation de la bibliothèque assetframe-lib pour Python pour créer et utiliser des données de magasin de fonctions |
Accès aux données à l'aide d'une fonction API ou d'une commande de système d'exploitation | Par exemple, utilisez : wget |
Non disponible | Accès aux données à l'aide d'une fonction d'API ou d'une commande de système d'exploitation |
Ajout d'un fichier à partir de votre système local
Pour ajouter un fichier de votre système local à votre projet à l'aide de l'éditeur de bloc-notes Jupyterlab:
- Ouvrez votre bloc-notes en mode édition.
- Dans la barre d'outils, cliquez sur l'icône Télécharger l'actif dans le projet et ajoutez votre fichier.
Charger des ensembles de données à partir du concentrateur de ressources
Les fichiers du concentrateur de ressources contiennent des données ouvertes. Regardez cette courte vidéo pour voir comment utiliser les ensembles de données publics dans le concentrateur de ressources.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Pour ajouter un ensemble de données du concentrateur de ressources à votre projet:
Dans le menu de navigation, sélectionnez Centre de ressources.
Recherchez la carte correspondant au fichier que vous souhaitez ajouter.
Cliquez sur Ajouter au projet, sélectionnez le projet, puis cliquez sur Ajouter. Cliquez sur Afficher le projet pour vous rendre à la page de présentation du projet. L'actif de données est ajouté à la liste des actifs de données de la page Actifs du projet.
Chargement de données à partir de fichiers
Prérequis Le fichier doit exister en tant qu'actif dans votre projet. Pour plus de détails, voir Ajout d'un fichier à partir de votre système local ou Chargement d'un ensemble de données à partir du concentrateur de ressources.
Pour charger des données d'un fichier de projet dans votre bloc-notes:
- Ouvrez votre bloc-notes en mode édition.
- Cliquez sur l'icône Extraits de code , cliquez sur Lire les données, puis sélectionnez le fichier de données de votre projet. Si vous souhaitez modifier votre sélection, utilisez l'icône Editer .
- Dans la liste déroulante Charger en tant que , sélectionnez l'option de chargement de votre choix. Si vous sélectionnez Données d'identification, seules les données d'identification d'accès au fichier seront générées. Pour plus de détails, voir Ajout de données d'identification.
- Cliquez dans une cellule de code vide dans votre bloc-notes, puis cliquez sur Insérer du code dans la cellule pour insérer le code généré. Vous pouvez également cliquer pour copier le code généré dans le presse-papiers, puis le coller dans votre bloc-notes.
Le code généré sert de démarrage rapide pour commencer à utiliser un ensemble de données. Pour les systèmes de production, examinez attentivement le code inséré pour déterminer s'il convient d'écrire votre propre code qui répond mieux à vos besoins.
Pour savoir quelles structures de données sont générées pour quel langage de bloc-notes et quel format de données, voir Prise en charge du chargement de données.
Chargement de données à partir de connexions de sources de données
Prérequis Pour pouvoir charger des données à partir d'un service de données IBM ou d'une source de données externe, vous devez créer ou ajouter une connexion à votre projet. Voir Ajout de connexions à des projets.
Pour charger des données à partir d'une connexion de source de données existante dans une structure de données dans votre bloc-notes :
- Ouvrez votre bloc-notes en mode édition.
- Cliquez sur l'icône Extraits de code , cliquez sur Lire les données, puis sélectionnez la connexion à la source de données de votre projet.
- Sélectionnez le schéma et choisissez une table. Si vous souhaitez modifier votre sélection, utilisez l'icône Editer .
- Sélectionnez l'option de chargement. Si vous sélectionnez Données d'identification, seules les métadonnées seront générées. Pour plus de détails, voir Ajout de données d'identification.
- Cliquez dans une cellule de code vide dans votre bloc-notes, puis insérez du code dans la cellule. Vous pouvez également cliquer pour copier le code généré dans le presse-papiers, puis le coller dans votre bloc-notes.
- Si nécessaire, saisissez vos informations d'identification personnelles pour les connexions de données verrouillées qui sont marquées par l'icône Clé Il s'agit d'une étape ponctuelle qui déverrouille définitivement la connexion pour vous. Une fois que vous avez déverrouillé la connexion, l'icône de clé n'apparaît plus. Pour plus d'informations, voir Ajout de connexions à des projets.
Le code généré sert de démarrage rapide pour commencer à utiliser une connexion. Pour les systèmes de production, examinez attentivement le code inséré pour déterminer s'il convient d'écrire votre propre code qui répond mieux à vos besoins.
Pour savoir quelles structures de données sont générées pour quel langage de bloc-notes et quel format de données, voir Prise en charge du chargement de données.
Ajout de données d'identification
Vous pouvez générer votre propre code pour accéder au fichier situé dans votre IBM Cloud Object Storage ou à un fichier accessible via une connexion. Cela est utile lorsque, par exemple, votre format de fichier n'est pas pris en charge par l'outil de génération de fragment. Avec les données d'identification, vous pouvez écrire votre propre code pour charger les données dans une structure de données dans une cellule de bloc-notes.
Pour ajouter les données d'identification:
- Cliquez sur l'icône Extraits de code , puis sur Lire les données.
- Cliquez dans une cellule de code vide de votre bloc-notes, sélectionnez Données d'identification comme option de chargement, puis chargez les données d'identification dans la cellule. Vous pouvez également cliquer pour copier les données d'identification dans le presse-papiers, puis les coller dans votre bloc-notes.
- Insérez vos données d'identification dans le code de votre bloc-notes pour accéder aux données. Par exemple, consultez ce code dans un article de blog pour Python.
Utilisez une fonction d'API ou une commande de système d'exploitation pour accéder aux données
Vous pouvez utiliser des fonctions d'API ou des commandes de système d'exploitation dans votre bloc-notes pour accéder aux données, par exemple, la commande wget
pour accéder aux données à l'aide des protocoles HTTP, HTTPS ou FTP. Lorsque vous utilisez ces types de fonctions et de commandes d'API, vous devez inclure le code qui définit le jeton d'accès au projet. Voir Ajoutez manuellement le jeton d'accès au projet.
Pour obtenir des informations de référence sur l'API, voir l'API du tronc commun de données et d'IA.
Rubrique parent: Blocs-notes et scripts