Pour obtenir la version la plus précise et la plus à jour de cette documentation, voir la version anglaise (originale). IBM n'est pas responsable des dommages ou pertes résultant de l'utilisation du contenu traduit automatiquement (machine).
RStudio
Dernière mise à jour : 14 janv. 2025
RStudio
R est un logiciel d'analyse statistique et d'apprentissage automatique très répandu qui permet de gérer les données et comprend des tests, des modèles, des analyses et des graphiques. RStudio, inclus dans IBM watsonx.ai Studio, fournit un environnement de développement intégré pour travailler avec des scripts R.
Informations sur l'utilisation et limitations
Copy link to section
RStudio est intégré dans les projets IBM watsonx.ai Studio. Vous pouvez le lancer après avoir créé un projet.
Vous pouvez accéder aux fichiers de données stockés dans le IBM Cloud Object Storage associé à votre projet et les utiliser.
Vous pouvez utiliser l'IDE RStudio pour créer des applications Shiny, mais vous ne pouvez pas les déployer dans Cloud Pak for Data as a Service
Démarrer l'IDE RStudio
Copy link to section
Pour démarrer l'IDE RStudio dans votre projet :
Cliquez sur RStudio dans le menu Lancer IDE de la barre d'actions de votre projet.
Sélectionnez un environnement.
Cliquez sur Lancer.
L'environnement d'exécution est initié et l'environnement de développement s'ouvre.
Résolution des problèmes de démarrage de l'IDE RStudio
Copy link to section
Vous pouvez rencontrer les problèmes suivants lorsque vous démarrez RStudio:
État RStudio corrompu à partir d'une session précédente
Copy link to section
Problème : ' Parfois, lorsque vous démarrez une session RStudio, il se peut que l'état de RStudio d'une session précédente soit corrompu et que votre session ne démarre pas. Solution : ' Après avoir lancé l'IDE RStudio, au moment où vous sélectionnez l'environnement RStudio, sélectionnez Réinitialiser l'espace de travail. RStudio est démarré en utilisant les paramètres par défaut avec un espace de travail RStudio propre.
Gestion des fichiers de données
Copy link to section
Dans RStudio, vous pouvez gérer des fichiers de données provenant de différentes sources :
Fichiers dans la structure de fichiers du serveur RStudio, que vous pouvez afficher en cliquant sur Fichiers dans la partie inférieure droite de RStudio. C'est là que vous pouvez créer des dossiers, télécharger des fichiers à partir de votre système local et supprimer des fichiers.
Pour accéder à ces fichiers dans R, vous devez définir le répertoire contenant les fichiers comme répertoire de travail. Pour ce faire, accédez au répertoire contenant les fichiers et cliquez sur Plus > Définir comme répertoire de travail.
N'oubliez pas que les fichiers stockés dans le répertoire Home de votre instance RStudio sont persistants dans votre instance et ne peuvent pas être partagés dans des environnements ou dans votre projet.
Regardez cette vidéo pour apprendre à charger des données dans RStudio.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Actifs de données de projet qui sont stockés dans le compartiment IBM Cloud Object Storage associé à votre projet. Lorsque RStudio est lancé, le contenu du compartiment IBM Cloud Object Storage est monté dans le répertoire project-objectstorage de votre répertoire RStudio Home.
Si vous souhaitez que des fichiers de données apparaissent dans le répertoire project-objectstorage , vous devez les ajouter en tant qu'actifs à votre projet. Voir Ajout de fichiers en tant qu'actifs de projet.
Si de nouveaux actifs de données sont ajoutés au projet pendant que vous êtes dans RStudio et que vous souhaitez y accéder, vous devez régénérer le dossier project-objectstorage.
Les données stockées dans un système de base de données.
Visionnez cette vidéo pour savoir comment vous connecter à des sources de données externes dans RStudio.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Fichiers stockés dans le stockage local qui sont montés sur /home/rstudio. Le répertoire " home a une limite de stockage de 2 Go et est utilisé pour stocker l'espace de travail de la session RStudio. Notez que vous disposez de 2 Go pour le stockage de votre répertoire " home dans tous vos projets, que vous utilisiez ou non RStudio dans chaque projet. Par conséquent, vous ne devez stocker que les fichiers script R et les fichiers de données de petite taille dans le répertoire home . Il n'est pas destiné aux fichiers de données volumineux ou aux sorties générées volumineuses. Tous les fichiers de données volumineux doivent être téléchargés en tant qu'actifs de projet, qui sont montés dans le répertoire project-objectstorage à partir duquel vous pouvez y accéder.
Ajout de fichiers sous forme d'actifs de projet
Copy link to section
Si vous souhaitez que vos fichiers de données apparaissent dans leproject-objectstorage répertoire, vous devez les ajouter à votre projet en tant qu'actifs de données. Pour ajouter ces fichiers en tant qu'actifs de données au projet :
Sur la page Assets du projet, cliquez sur l'icône Upload asset to project et sélectionnez l'onglet Files.
Sélectionnez les fichiers que vous souhaitez ajouter au projet en tant qu'actifs.
Dans la liste Actions, sélectionnez Ajouter en tant qu'actif de données et appliquez vos modifications.
Consommation de capacité et portée de l'environnement d'exécution
Copy link to section
L'exécution d'un environnement RStudio est toujours limitée à un modèle d'environnement et à un utilisateur de session RStudio. Une seule session RStudio peut être active par utilisateur de watsonx.ai Studio à la fois. Si vous avez démarré RStudio dans un autre projet, il vous est demandé si vous souhaitez arrêter cette session et démarrer une nouvelle session RStudio dans le contexte du projet en cours dans lequel vous travaillez.
L'utilisation d'exécution est calculée selon le nombre d'unités de capacité-heures (CUH, Capacity Units-Hours)
consommées par l'environnement d'exécution actif. Les CUH consommées par un environnement d'exécution RStudio actif dans un projet sont imputées au compte du créateur du projet. Voir facturation des unités de capacité par heure pour RStudio.
Vous pouvez voir les environnements d'exécution d'environnement RStudio actifs sur la page Environnements du projet. Vous pouvez arrêter votre environnement d'exécution à partir de cette page.
N'oubliez pas : Le compteur CUH continue à augmenter lorsque l'environnement d'exécution est actif, alors arrêtez l'exécution si vous n'utilisez pas RStudio. Si vous n'arrêtez pas explicitement la durée d'exécution, elle s'arrête pour vous après une période d'inactivité de 2 heures. Pendant ce laps de temps, vous continuerez de consommer des CUH qui vous seront facturées. Les travaux requérant un calcul intensif sont arrêtés de force au bout de 24 heures.
Regardez cette vidéo pour découvrir une présentation de RStudio IDE.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Transcription
Retranscription de la vidéo
Heure
Transcription
00:00
Cette vidéo est une visite rapide de l'environnement de développement intégré RStudio à l'intérieur d'un projet.
00:07
À partir de n'importe quel projet, vous pouvez lancer l'IDE RStudio.
00:12
RStudio est un environnement de développement intégré libre et gratuit pour R, un langage de programmation pour le calcul statistique et les graphiques.
00:22
Dans RStudio, il y a quatre volets : le volet source, le volet console, le volet environnement et le volet fichiers.
00:32
Les panneaux vous aident à organiser votre travail et à séparer les différentes tâches que vous allez effectuer avec R.
00:39
Vous pouvez faire glisser pour redimensionner les panneaux ou utiliser les icônes pour réduire et agrandir un panneau.
00:47
Vous pouvez également réorganiser les panneaux dans les options globales.
00:53
La sous-fenêtre de la console est votre interface avec R.
00:56
C'est exactement ce que vous verriez dans la fenêtre de terminal ou les interfaces utilisateur fournies avec R.
01:01
Le panneau de la console comporte des fonctions ajoutées qui vous seront utiles.
01:06
Pour exécuter du code à partir de la console, entrez simplement la commande.
01:11
Commencez à taper une commande pour afficher la liste des commandes commençant par les lettres que vous avez entrées.
01:17
Mettez en évidence une commande dans la liste et appuyez sur "Entrée" pour l'insérer.
01:24
Utilisez la flèche vers le haut pour faire défiler les commandes que vous avez précédemment entrées.
01:31
A mesure que vous émettez d'autres commandes, vous pouvez faire défiler les résultats.
01:36
Utilisez l'option de menu pour effacer la console.
01:39
Vous pouvez également utiliser la saisie semi-automatique pour afficher la liste des fonctions, des objets et des jeux de données commençant par ce texte.
01:47
Et utilisez les flèches pour mettre en évidence une commande afin d'afficher l'aide pour cette commande.
01:51
Lorsque vous êtes prêt, appuyez sur "Entrée" pour l'insérer.
01:55
Vous verrez ensuite la liste des options de cette commande dans le contexte en cours.
01:59
Par exemple, le premier argument de la fonction read.csv est le fichier.
02:05
RStudio affiche une liste des dossiers et des fichiers de votre répertoire de travail, afin que vous puissiez facilement localiser le fichier à inclure dans l'argument.
02:16
Enfin, si vous utilisez l'exécution de l'onglet avec une fonction qui attend un nom de package, telle qu'une bibliothèque, vous verrez une liste de tous les packages installés.
02:28
Ensuite, regardons le panneau source, qui est simplement un éditeur de texte pour vous permettre d'écrire votre code R.
02:34
L'éditeur de texte prend en charge les fichiers de commandes R et le texte en clair, ainsi que plusieurs autres langues, et inclut une mise en évidence spécifique à la langue dans le contexte.
02:47
Et vous remarquerez que la complétion de l'onglet est également disponible dans l'éditeur de texte.
02:53
Dans l'éditeur de texte, vous pouvez exécuter une seule ligne de code ou sélectionner plusieurs lignes de code à exécuter. Les résultats s'affichent dans le panneau de la console.
03:08
Vous pouvez sauvegarder votre code en tant que script R pour le partager ou l'exécuter à nouveau ultérieurement.
03:15
La fonction de vue ouvre un nouvel onglet qui affiche le cadre de données sous forme de feuille de calcul.
03:22
Vous pouvez également l'afficher dans sa propre fenêtre.
03:25
Vous pouvez maintenant faire défiler les données, trier les colonnes, rechercher des valeurs spécifiques ou filtrer les lignes à l'aide des curseurs et des menus déroulants.
03:41
La sous-fenêtre d'environnement contient un onglet "Environnement", un onglet "Historique" et un onglet "Connexions", et conserve une trace de ce qui s'est passé dans cette session R.
03:51
L'onglet "Environnement" contient les objets R qui existent dans votre environnement global et qui ont été créés lors de la session.
03:58
Ainsi, lorsque vous créez un nouvel objet dans le panneau de la console, il s'affiche automatiquement dans le panneau de l'environnement.
04:04
Vous pouvez également afficher les objets associés à un package spécifique, et même voir le code source d'une fonction spécifique.
04:12
Vous pouvez également voir une liste des ensembles de données, développer un ensemble de données pour inspecter ses éléments individuels et les afficher dans le panneau source.
04:22
Vous pouvez sauvegarder le contenu d'un environnement en tant que fichier .RData, afin de pouvoir le charger ultérieurement.
04:29
A partir de là, vous pouvez également effacer les objets de l'espace de travail.
04:33
Si vous souhaitez supprimer des éléments spécifiques, utilisez la vue de grille.
04:38
Par exemple, vous pouvez facilement trouver des éléments volumineux à supprimer pour libérer de la mémoire dans votre session R.
04:45
L'onglet "Environnement" vous permet également d'importer un jeu de données.
04:50
Vous pouvez afficher un aperçu du jeu de données et des options de modification avant de terminer l'importation.
04:55
Les données importées s'afficheront dans le panneau source.
05:00
L'onglet "Historique" affiche un historique de chacune des commandes que vous exécutez sur la ligne de commande.
05:05
Tout comme l'onglet "Environnement", vous pouvez enregistrer l'historique en tant que fichier. Rhistory, afin de pouvoir l'ouvrir à une date ultérieure.
05:11
Et cet onglet a les mêmes options pour effacer toutes les entrées de l'historique et les entrées individuelles de l'historique.
05:17
Sélectionnez une commande et envoyez-la à la console pour réexécuter la commande.
05:23
Vous pouvez également copier une commande dans le panneau source pour l'inclure dans un script.
05:31
Dans l'onglet "Connexions", vous pouvez créer une nouvelle connexion à une source de données.
05:36
Les options de cette boîte de dialogue dépendent des packages que vous avez installés.
05:41
Par exemple, une connexion "BLUDB" vous permet de vous connecter à un service Db2 Warehouse on Cloud .
05:49
Le panneau des fichiers contient les onglets "Fichiers", "Tracés", "Packages", "Aide" et "Visualiseur".
05:55
L'onglet "Fichiers" affiche le contenu de votre répertoire de travail.
05:59
RStudio chargera les fichiers de ce répertoire et enregistrera les fichiers dans ce répertoire.
06:04
Accédez à un fichier et cliquez dessus pour l'afficher dans le panneau source.
06:09
A partir de là, vous pouvez créer de nouveaux dossiers et envoyer des fichiers par téléchargement, en sélectionnant des fichiers individuels à envoyer par téléchargement ou en sélectionnant un fichier .zip contenant tous les fichiers à envoyer par téléchargement.
06:25
A partir de là, vous pouvez également supprimer et renommer des fichiers et des dossiers.
06:30
Pour accéder au fichier dans R, vous devez définir le dossier de données en tant que répertoire de travail.
06:36
Vous verrez que la commande setwd a été exécutée dans la console.
06:43
Vous pouvez accéder aux actifs de données de votre projet en ouvrant le dossier du projet.
06:50
L'onglet "Tracés" affiche les résultats des fonctions de tracé de R, telles que: tracé, hist, ggplot et xyplot
07:00
Vous pouvez naviguer dans différents tracés à l'aide des flèches ou effectuer un zoom pour afficher un graphique en plein écran.
07:09
Vous pouvez également supprimer des tracés individuels ou tous les tracés à partir de cette page.
07:13
Utilisez l'option "Exporter" pour enregistrer le tracé en tant que fichier graphique ou d'impression à la résolution spécifiée.
07:21
L'onglet "Packages" affiche les packages que vous avez installés dans votre bibliothèque système.
07:26
La barre de recherche vous permet de trouver rapidement un package spécifique.
07:30
Les packages vérifiés sont ceux qui ont déjà été chargés, à l'aide de la commande de bibliothèque, dans la session en cours.
07:38
Vous pouvez vérifier des packages supplémentaires à partir d'ici pour les charger ou désélectionner des packages pour les déconnecter de la session en cours.
07:45
Le panneau de la console affiche les résultats.
07:48
Utilisez le "X" en regard d'un nom de module pour le supprimer de la bibliothèque système.
07:54
Vous pouvez également trouver de nouveaux packages à installer ou à mettre à jour vers la dernière version de n'importe quel package.
08:03
En cliquant sur l'un des packages, vous ouvrez l'onglet "Aide" qui contient des informations supplémentaires sur ce package.
08:09
A partir de là, vous pouvez rechercher des fonctions pour obtenir plus d'aide.
08:13
A partir de la console, vous pouvez utiliser la commande help ou simplement entrer un point d'interrogation suivi de la fonction pour obtenir de l'aide sur cette fonction.
08:21
L'onglet "Visualiseur" affiche la sortie HTML.
08:25
Certaines fonctions R génèrent du code HTML pour afficher des rapports et des graphiques interactifs.
08:31
Le paquet R Markdown crée des rapports que vous pouvez consulter dans l'onglet "Viewer".
08:38
Le package Shiny crée des applications Web que vous pouvez afficher dans l'onglet "Visualiseur".
08:44
D'autres packages s'appuient sur l'infrastructure htmlwidgets et incluent des visualisations interactives basées sur Java.
08:54
Vous pouvez également publier la visualisation sur le site libre, appelé "RPubs.com".
09:01
Il s'agit d'une brève présentation de l'IDE RStudio.
09:05
Vous trouverez d'autres vidéos sur la documentation de RStudio in the Cloud Pak for Data as a Service.
Use this interactive map to learn about the relationships between your tasks, the tools you need, the services that provide the tools, and where you use the tools.
Select any task, tool, service, or workspace
You'll learn what you need, how to get it, and where to use it.
Some tools perform the same tasks but have different features and levels of automation.
Jupyter notebook editor
Prepare data
Visualize data
Build models
Deploy assets
Create a notebook in which you run Python, R, or Scala code to prepare, visualize, and analyze data, or build a model.
AutoAI
Build models
Automatically analyze your tabular data and generate candidate model pipelines customized for your predictive modeling problem.
SPSS Modeler
Prepare data
Visualize data
Build models
Create a visual flow that uses modeling algorithms to prepare data and build and train a model, using a guided approach to machine learning that doesn’t require coding.
Decision Optimization
Build models
Visualize data
Deploy assets
Create and manage scenarios to find the best solution to your optimization problem by comparing different combinations of your model, data, and solutions.
Data Refinery
Prepare data
Visualize data
Create a flow of ordered operations to cleanse and shape data. Visualize data to identify problems and discover insights.
Orchestration Pipelines
Prepare data
Build models
Deploy assets
Automate the model lifecycle, including preparing data, training models, and creating deployments.
RStudio
Prepare data
Build models
Deploy assets
Work with R notebooks and scripts in an integrated development environment.
Federated learning
Build models
Create a federated learning experiment to train a common model on a set of remote data sources. Share training results without sharing data.
Deployments
Deploy assets
Monitor models
Deploy and run your data science and AI solutions in a test or production environment.
Catalogs
Catalog data
Governance
Find and share your data and other assets.
Metadata import
Prepare data
Catalog data
Governance
Import asset metadata from a connection into a project or a catalog.
Metadata enrichment
Prepare data
Catalog data
Governance
Enrich imported asset metadata with business context, data profiling, and quality assessment.
Data quality rules
Prepare data
Governance
Measure and monitor the quality of your data.
Masking flow
Prepare data
Create and run masking flows to prepare copies of data assets that are masked by advanced data protection rules.
Governance
Governance
Create your business vocabulary to enrich assets and rules to protect data.
Data lineage
Governance
Track data movement and usage for transparency and determining data accuracy.
AI factsheet
Governance
Monitor models
Track AI models from request to production.
DataStage flow
Prepare data
Create a flow with a set of connectors and stages to transform and integrate data. Provide enriched and tailored information for your enterprise.
Data virtualization
Prepare data
Create a virtual table to segment or combine data from one or more tables.
OpenScale
Monitor models
Measure outcomes from your AI models and help ensure the fairness, explainability, and compliance of all your models.
Data replication
Prepare data
Replicate data to target systems with low latency, transactional integrity and optimized data capture.
Master data
Prepare data
Consolidate data from the disparate sources that fuel your business and establish a single, trusted, 360-degree view of your customers.
Services you can use
Services add features and tools to the platform.
watsonx.ai Studio
Develop powerful AI solutions with an integrated collaborative studio and industry-standard APIs and SDKs. Formerly known as Watson Studio.
watsonx.ai Runtime
Quickly build, run and manage generative AI and machine learning applications with built-in performance and scalability. Formerly known as Watson Machine Learning.
IBM Knowledge Catalog
Discover, profile, catalog, and share trusted data in your organization.
DataStage
Create ETL and data pipeline services for real-time, micro-batch, and batch data orchestration.
Data Virtualization
View, access, manipulate, and analyze your data without moving it.
Watson OpenScale
Monitor your AI models for bias, fairness, and trust with added transparency on how your AI models make decisions.
Data Replication
Provide efficient change data capture and near real-time data delivery with transactional integrity.
Match360 with Watson
Improve trust in AI pipelines by identifying duplicate records and providing reliable data about your customers, suppliers, or partners.
Manta Data Lineage
Increase data pipeline transparency so you can determine data accuracy throughout your models and systems.
Where you'll work
Collaborative workspaces contain tools for specific tasks.
Project
Where you work with data.
> Projects > View all projects
Catalog
Where you find and share assets.
> Catalogs > View all catalogs
Space
Where you deploy and run assets that are ready for testing or production.
> Deployments
Categories
Where you manage governance artifacts.
> Governance > Categories
Data virtualization
Where you virtualize data.
> Data > Data virtualization
Master data
Where you consolidate data into a 360 degree view.
À propos des cookies sur ce sitePour fonctionner correctement, nos sites Internet nécessitent certains cookies (requis). En outre, d'autres cookies peuvent être utilisés avec votre consentement pour analyser l'utilisation d'un site, améliorer l'expérience des utilisateurs et à des fins publicitaires.Pour plus informations, passez en revue vos options de préférences en préférences en matière de cookies. En visitant notre site Web, vous acceptez que nous traitions les informations comme décrit dans ladéclaration de confidentialité d’IBM.Pour faciliter la navigation, vos préférences en matière de cookie seront partagées dans les domaines Web d'IBM énumérés ici.