R est un logiciel d'analyse statistique et d'apprentissage automatique très répandu qui permet de gérer les données et comprend des tests, des modèles, des analyses et des graphiques. RStudio, inclus dans IBM watsonx.ai Studio, fournit un environnement de développement intégré pour travailler avec des scripts R.
Informations sur l'utilisation et limitations
- RStudio est intégré dans les projets IBM watsonx.ai Studio. Vous pouvez le lancer après avoir créé un projet.
- Vous pouvez accéder aux fichiers de données stockés dans le IBM Cloud Object Storage associé à votre projet et les utiliser.
- Vous pouvez utiliser l'IDE RStudio pour créer des applications Shiny, mais vous ne pouvez pas les déployer dans IBM watsonx.
Démarrer l'IDE RStudio
Pour démarrer l'IDE RStudio dans votre projet :
Cliquez sur RStudio dans le menu Lancer IDE de la barre d'actions de votre projet.
Sélectionnez un environnement.
Cliquez sur Lancer.
L'environnement d'exécution est initié et l'environnement de développement s'ouvre.
Si vous rencontrez des problèmes au démarrage de RStudio, reportez-vous à la section Résolution des problèmes de démarrage de RStudio.
Résolution des problèmes de démarrage de l'IDE RStudio
Vous pouvez rencontrer les problèmes suivants lorsque vous démarrez RStudio :
État RStudio corrompu à partir d'une session précédente
Problème :
Parfois, lorsque vous démarrez une session RStudio, il se peut que l'état de RStudio d'une session précédente soit corrompu et que votre session ne démarre pas.
Solution :
Après avoir lancé l'IDE RStudio, au moment où vous sélectionnez l'environnement RStudio, sélectionnez Réinitialiser l'espace de travail. RStudio est démarré en utilisant les paramètres par défaut avec un espace de travail RStudio propre.
Gestion des fichiers de données
Dans RStudio, vous pouvez gérer des fichiers de données provenant de différentes sources :
Fichiers dans la structure de fichiers du serveur RStudio, que vous pouvez afficher en cliquant sur Fichiers dans la partie inférieure droite de RStudio. C'est là que vous pouvez créer des dossiers, télécharger des fichiers à partir de votre système local et supprimer des fichiers.
Pour accéder à ces fichiers dans R, vous devez définir le répertoire contenant les fichiers comme répertoire de travail. Pour ce faire, accédez au répertoire contenant les fichiers et cliquez sur Plus > Définir comme répertoire de travail.
N'oubliez pas que les fichiers stockés dans le répertoire
Home
de votre instance RStudio sont persistants dans votre instance et ne peuvent pas être partagés dans des environnements ou dans votre projet.Avertissement vidéo: Certaines étapes mineures et certains éléments graphiques des vidéos de cette page peuvent différer de votre déploiement.Regardez cette vidéo pour apprendre à charger des données dans RStudio.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Actifs de données de projet qui sont stockés dans le compartiment IBM Cloud Object Storage associé à votre projet. Lorsque RStudio est lancé, le contenu du compartiment IBM Cloud Object Storage est monté dans le répertoire
project-objectstorage
de votre répertoire RStudioHome
.Si vous souhaitez que des fichiers de données apparaissent dans le répertoire
project-objectstorage
, vous devez les ajouter en tant qu'actifs à votre projet. Voir Ajout de fichiers en tant qu'actifs de projet.Si de nouveaux actifs de données sont ajoutés au projet pendant que vous êtes dans RStudio et que vous souhaitez y accéder, vous devez régénérer le dossier
project-objectstorage
.Voir comment lire et écrire des données depuis et vers Cloud Object Storage.
Les données stockées dans un système de base de données.
Visionnez cette vidéo pour savoir comment vous connecter à des sources de données externes dans RStudio.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Fichiers stockés dans le stockage local qui sont montés sur
/home/rstudio
. Le répertoirehome
a une limite de stockage de 2 Go et est utilisé pour stocker l'espace de travail de la session RStudio. Notez que vous disposez de 2 Go pour le stockage de votre répertoirehome
pour l'ensemble de vos projets, que vous utilisiez ou non RStudio dans chaque projet. Par conséquent, vous ne devez stocker que les fichiers script R et les fichiers de données de petite taille dans le répertoirehome
. Il n'est pas destiné aux fichiers de données volumineux ou aux sorties générées volumineuses. Tous les fichiers de données volumineux doivent être téléchargés en tant qu'actifs de projet, qui sont montés dans le répertoireproject-objectstorage
à partir duquel vous pouvez y accéder.
Ajout de fichiers sous forme d'actifs de projet
Si vous souhaitez que vos fichiers de données apparaissent dans leproject-objectstorage
répertoire, vous devez les ajouter à votre projet en tant qu'actifs de données. Pour ajouter ces fichiers sous forme d'actifs de données au projet :
- Sur la page Assets du projet, cliquez sur l'icône Upload asset to project et sélectionnez l'onglet Files.
- Sélectionnez les fichiers que vous souhaitez ajouter au projet en tant qu'actifs.
- Dans la liste Actions, sélectionnez Ajouter en tant qu'actif de données et appliquez vos modifications.
Consommation de capacité et portée de l'environnement d'exécution
L'exécution d'un environnement RStudio est toujours limitée à un modèle d'environnement et à un utilisateur de session RStudio. Une seule session RStudio peut être active par utilisateur de watsonx.ai Studio à la fois. Si vous avez démarré RStudio dans un autre projet, il vous est demandé si vous souhaitez arrêter cette session et démarrer une nouvelle session RStudio dans le contexte du projet en cours dans lequel vous travaillez.
L'utilisation d'exécution est calculée selon le nombre d'unités de capacité-heures (CUH, Capacity Units-Hours) consommées par l'environnement d'exécution actif. Les CUH consommées par un environnement d'exécution RStudio actif dans un projet sont imputées au compte du créateur du projet. Voir facturation des unités de capacité par heure pour RStudio.
Vous pouvez voir les environnements d'exécution d'environnement RStudio actifs sur la page Environnements du projet. Vous pouvez arrêter votre environnement d'exécution à partir de cette page.
N'oubliez pas : Le compteur CUH continue à augmenter lorsque l'environnement d'exécution est actif, alors arrêtez l'exécution si vous n'utilisez pas RStudio. Si vous n'arrêtez pas explicitement la durée d'exécution, elle s'arrête pour vous après une période d'inactivité de 2 heures. Pendant ce laps de temps, vous continuerez de consommer des CUH qui vous seront facturées. Les travaux requérant un calcul intensif sont arrêtés de force au bout de 24 heures.
Regardez cette vidéo pour découvrir une présentation de RStudio IDE.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Retranscription de la vidéo Heure Transcription 00:00 Cette vidéo est une visite rapide de l'environnement de développement intégré RStudio à l'intérieur d'un projet. 00:07 À partir de n'importe quel projet, vous pouvez lancer l'IDE RStudio. 00:12 RStudio est un environnement de développement intégré libre et gratuit pour R, un langage de programmation pour le calcul statistique et les graphiques. 00:22 Dans RStudio, il y a quatre volets : le volet source, le volet console, le volet environnement et le volet fichiers. 00:32 Les panneaux vous aident à organiser votre travail et à séparer les différentes tâches que vous allez effectuer avec R. 00:39 Vous pouvez faire glisser pour redimensionner les panneaux ou utiliser les icônes pour réduire et agrandir un panneau. 00:47 Vous pouvez également réorganiser les panneaux dans les options globales. 00:53 La sous-fenêtre de la console est votre interface avec R. 00:56 C'est exactement ce que vous verriez dans la fenêtre de terminal ou les interfaces utilisateur fournies avec R. 01:01 Le panneau de la console comporte des fonctions ajoutées qui vous seront utiles. 01:06 Pour exécuter du code à partir de la console, entrez simplement la commande. 01:11 Commencez à taper une commande pour afficher la liste des commandes commençant par les lettres que vous avez entrées. 01:17 Mettez en évidence une commande dans la liste et appuyez sur "Entrée" pour l'insérer. 01:24 Utilisez la flèche vers le haut pour faire défiler les commandes que vous avez précédemment entrées. 01:31 A mesure que vous émettez d'autres commandes, vous pouvez faire défiler les résultats. 01:36 Utilisez l'option de menu pour effacer la console. 01:39 Vous pouvez également utiliser la saisie semi-automatique pour afficher la liste des fonctions, des objets et des jeux de données commençant par ce texte. 01:47 Et utilisez les flèches pour mettre en évidence une commande afin d'afficher l'aide pour cette commande. 01:51 Lorsque vous êtes prêt, appuyez sur "Entrée" pour l'insérer. 01:55 Vous verrez ensuite la liste des options de cette commande dans le contexte en cours. 01:59 Par exemple, le premier argument de la fonction read.csv est le fichier. 02:05 RStudio affiche une liste des dossiers et des fichiers de votre répertoire de travail, afin que vous puissiez facilement localiser le fichier à inclure dans l'argument. 02:16 Enfin, si vous utilisez l'exécution de l'onglet avec une fonction qui attend un nom de package, telle qu'une bibliothèque, vous verrez une liste de tous les packages installés. 02:28 Ensuite, regardons le panneau source, qui est simplement un éditeur de texte pour vous permettre d'écrire votre code R. 02:34 L'éditeur de texte prend en charge les fichiers de commandes R et le texte en clair, ainsi que plusieurs autres langues, et inclut une mise en évidence spécifique à la langue dans le contexte. 02:47 Et vous remarquerez que la complétion de l'onglet est également disponible dans l'éditeur de texte. 02:53 Dans l'éditeur de texte, vous pouvez exécuter une seule ligne de code ou sélectionner plusieurs lignes de code à exécuter. Les résultats s'affichent dans le panneau de la console. 03:08 Vous pouvez sauvegarder votre code en tant que script R pour le partager ou l'exécuter à nouveau ultérieurement. 03:15 La fonction de vue ouvre un nouvel onglet qui affiche le cadre de données sous forme de feuille de calcul. 03:22 Vous pouvez également l'afficher dans sa propre fenêtre. 03:25 Vous pouvez maintenant faire défiler les données, trier les colonnes, rechercher des valeurs spécifiques ou filtrer les lignes à l'aide des curseurs et des menus déroulants. 03:41 La sous-fenêtre d'environnement contient un onglet "Environnement", un onglet "Historique" et un onglet "Connexions", et conserve une trace de ce qui s'est passé dans cette session R. 03:51 L'onglet "Environnement" contient les objets R qui existent dans votre environnement global et qui ont été créés lors de la session. 03:58 Ainsi, lorsque vous créez un nouvel objet dans le panneau de la console, il s'affiche automatiquement dans le panneau de l'environnement. 04:04 Vous pouvez également afficher les objets associés à un package spécifique, et même voir le code source d'une fonction spécifique. 04:12 Vous pouvez également voir une liste des ensembles de données, développer un ensemble de données pour inspecter ses éléments individuels et les afficher dans le panneau source. 04:22 Vous pouvez sauvegarder le contenu d'un environnement en tant que fichier .RData, afin de pouvoir le charger ultérieurement. 04:29 A partir de là, vous pouvez également effacer les objets de l'espace de travail. 04:33 Si vous souhaitez supprimer des éléments spécifiques, utilisez la vue de grille. 04:38 Par exemple, vous pouvez facilement trouver des éléments volumineux à supprimer pour libérer de la mémoire dans votre session R. 04:45 L'onglet "Environnement" vous permet également d'importer un jeu de données. 04:50 Vous pouvez afficher un aperçu du jeu de données et des options de modification avant de terminer l'importation. 04:55 Les données importées s'afficheront dans le panneau source. 05:00 L'onglet "Historique" affiche un historique de chacune des commandes que vous exécutez sur la ligne de commande. 05:05 Tout comme l'onglet "Environnement", vous pouvez enregistrer l'historique en tant que fichier. Rhistory, afin de pouvoir l'ouvrir à une date ultérieure. 05:11 Et cet onglet a les mêmes options pour effacer toutes les entrées de l'historique et les entrées individuelles de l'historique. 05:17 Sélectionnez une commande et envoyez-la à la console pour réexécuter la commande. 05:23 Vous pouvez également copier une commande dans le panneau source pour l'inclure dans un script. 05:31 Dans l'onglet "Connexions", vous pouvez créer une nouvelle connexion à une source de données. 05:36 Les options de cette boîte de dialogue dépendent des packages que vous avez installés. 05:41 Par exemple, une connexion "BLUDB" vous permet de vous connecter à un service Db2 Warehouse on Cloud . 05:49 Le panneau des fichiers contient les onglets "Fichiers", "Tracés", "Packages", "Aide" et "Visualiseur". 05:55 L'onglet "Fichiers" affiche le contenu de votre répertoire de travail. 05:59 RStudio chargera les fichiers de ce répertoire et enregistrera les fichiers dans ce répertoire. 06:04 Accédez à un fichier et cliquez dessus pour l'afficher dans le panneau source. 06:09 A partir de là, vous pouvez créer de nouveaux dossiers et envoyer des fichiers par téléchargement, en sélectionnant des fichiers individuels à envoyer par téléchargement ou en sélectionnant un fichier .zip contenant tous les fichiers à envoyer par téléchargement. 06:25 A partir de là, vous pouvez également supprimer et renommer des fichiers et des dossiers. 06:30 Pour accéder au fichier dans R, vous devez définir le dossier de données en tant que répertoire de travail. 06:36 Vous verrez que la commande setwd a été exécutée dans la console. 06:43 Vous pouvez accéder aux actifs de données de votre projet en ouvrant le dossier du projet. 06:50 L'onglet "Tracés" affiche les résultats des fonctions de tracé de R, telles que: tracé, hist, ggplot et xyplot 07:00 Vous pouvez naviguer dans différents tracés à l'aide des flèches ou effectuer un zoom pour afficher un graphique en plein écran. 07:09 Vous pouvez également supprimer des tracés individuels ou tous les tracés à partir de cette page. 07:13 Utilisez l'option "Exporter" pour enregistrer le tracé en tant que fichier graphique ou d'impression à la résolution spécifiée. 07:21 L'onglet "Packages" affiche les packages que vous avez installés dans votre bibliothèque système. 07:26 La barre de recherche vous permet de trouver rapidement un package spécifique. 07:30 Les packages vérifiés sont ceux qui ont déjà été chargés, à l'aide de la commande de bibliothèque, dans la session en cours. 07:38 Vous pouvez vérifier des packages supplémentaires à partir d'ici pour les charger ou désélectionner des packages pour les déconnecter de la session en cours. 07:45 Le panneau de la console affiche les résultats. 07:48 Utilisez le "X" en regard d'un nom de module pour le supprimer de la bibliothèque système. 07:54 Vous pouvez également trouver de nouveaux packages à installer ou à mettre à jour vers la dernière version de n'importe quel package. 08:03 En cliquant sur l'un des packages, vous ouvrez l'onglet "Aide" qui contient des informations supplémentaires sur ce package. 08:09 A partir de là, vous pouvez rechercher des fonctions pour obtenir plus d'aide. 08:13 A partir de la console, vous pouvez utiliser la commande help ou simplement entrer un point d'interrogation suivi de la fonction pour obtenir de l'aide sur cette fonction. 08:21 L'onglet "Visualiseur" affiche la sortie HTML. 08:25 Certaines fonctions R génèrent du code HTML pour afficher des rapports et des graphiques interactifs. 08:31 Le pack de démarque R crée des rapports que vous pouvez afficher dans l'onglet "Visualiseur". 08:38 Le package Shiny crée des applications Web que vous pouvez afficher dans l'onglet "Visualiseur". 08:44 D'autres packages s'appuient sur l'infrastructure htmlwidgets et incluent des visualisations interactives basées sur Java. 08:54 Vous pouvez également publier la visualisation sur le site libre, appelé "RPubs.com". 09:01 Il s'agit d'une brève présentation de l'IDE RStudio. 09:05 Vous trouverez d'autres vidéos sur la documentation de RStudio in the Cloud Pak for Data as a Service.
Rubrique parent: Blocs-notes et scripts