0 / 0
Go back to the English version of the documentation
RStudio
Last updated: 2024年12月11日
RStudio

R 是一种流行的统计分析和机器学习软件包,可用于数据管理,包括测试、模型、分析和图形。RStudio 包含在IBM watsonx.aiStudio 中,为使用 R 脚本提供了一个集成开发环境。

使用信息和限制

  • RStudio已集成到IBM watsonx.aiStudio 项目中。 您可以在创建项目后启动它。
  • 您可以访问和使用存储在与项目相关联的 IBM Cloud Object Storage 存储桶中的数据文件。
  • 您可以使用RStudioIDE 创建 Shiny 应用程序,但不能将它们部署到Cloud Pak for Data as a Service中。

启动RStudio集成开发环境

在项目中启动RStudioIDE:

  1. 从项目操作栏上的 "启动 IDE"菜单中单击RStudio

  2. 选择环境。

  3. 单击启动

    这会启动环境运行时,开发环境随即打开。

    如果在启动RStudio 时遇到问题,请参阅故障排除与启动RStudio有关的问题

启动RStudioIDE 时的故障排除问题

启动RStudio 时可能会遇到以下问题:

前一个会话中损坏的RStudio状态

问题:"
有时,当您启动RStudio会话时,可能会遇到前一个会话的RStudio状态已损坏的情况,导致会话无法启动。
解决方案:'
启动RStudioIDE 后,在选择RStudio环境的阶段,选择重置工作区。 启动RStudio时使用的是默认设置和干净的RStudio工作区。

处理数据文件

在 RStudio 中,您可以处理来自不同源的数据文件:

  • RStudio 服务器文件结构中的文件,您可通过单击 RStudio 右下角的文件来查看这些文件。 您可以在这里创建文件夹、从本地系统上载文件,以及删除文件。

    要在 R 中访问这些文件,必须将工作目录设置为这些文件所在的目录。 您可以通过使用文件浏览到目录并单击 更多> 设置为工作目录来执行此操作。

    请注意,存储在 Rstudio 实例的 Home 目录中的文件仅在该实例中持久存储,无法跨环境或在项目中共享。

    请观看此视频,以了解如何将数据装入到 RStudio 中。

    此视频提供了一种可视方法来学习本文档中的概念和任务。

  • 存储在与项目关联的 IBM Cloud Object Storage 存储区中的项目数据资产。 启动 RStudio 后,IBM Cloud Object Storage 存储区内容将安装到 RStudio Home 目录中的 project-objectstorage 目录。

    如果希望数据文件显示在 project-objectstorage 目录中,那么必须将其作为资产添加到项目。 请参阅将文件添加为项目资产

    如果在您处于 RStudio 中时将新数据资产添加到项目,并且您要访问这些数据资产,那么需要刷新 project-objectstorage 文件夹。

    请参阅如何在 Cloud Object Storage 中读取和写入数据

  • 存储在数据库系统中的数据

    观看此视频以了解如何在 RStudio 中连接到外部数据源。

    此视频提供了一种可视方法来学习本文档中的概念和任务。

  • 安装到 /home/rstudio存储在本地存储器中的文件home目录的存储限制为 2 GB,用于存储RStudio会话工作区。 请注意,无论您是否在每个项目中使用RStudio,您的 "home目录存储空间在所有项目中都分配为 2 GB。 因此,您只应该将 R 脚本文件和小数据文件存储在 home 目录中。 它不适用于大型数据文件或大型生成的输出。 应将所有大型数据文件作为项目资产上载,这些资产将安装到 project-objectstorage 目录中,您可以从该目录访问这些数据文件。

将文件添加为项目资产

如果希望数据文件出现在 project-objectstorage 目录中,必须将它们作为数据资产添加到项目中。 要将这些文件作为数据资产添加到项目中,请执行以下操作:

  1. 在项目的 "资产 "页面上,单击 Upload asset to project 图标 "将资产上载到项目" 图标 并选择 Files 选项卡。
  2. 选择要作为资产添加到项目中的文件。
  3. 从“操作”列表中,选择添加为数据资产并应用更改。

容量使用情况和运行时作用域

RStudio环境运行时的作用域总是环境模板和RStudio会话用户。 每个watsonx.aiStudio 用户一次只能激活一个RStudio会话。 如果您在另一个项目中启动了RStudio,系统会询问您是否要停止该会话,并在当前项目的上下文中启动一个新的RStudio会话。

运行时使用情况根据活动环境运行时使用的容量单位小时数 (CUH) 进行计算。 项目中的活动 RStudio 运行时使用的 CUH 会计入项目创建者的帐户。 请参阅 RStudio 的每小时容量单位计费

您可以在项目的 "环"页面上查看哪些RStudio环境运行时处于活动状态。 您可以从此页面停止运行时。

切记:当运行时处于激活状态时,CUH 计数器会继续增加,因此如果您不使用RStudio,请停止运行时。 如果您没有明确停止运行时间,则运行时间会在闲置 2 小时后自动停止。 在此空闲时间内,您将继续使用您所付费的 CUH。 长时间计算密集型作业会在 24 小时后硬停止。

观看此视频以领会对 RStudio IDE 的概述。

此视频提供了一种可视方法来学习本文档中的概念和任务。

  • 视频脚本
    时间 脚本
    00:00 这段视频将快速介绍一个项目中的RStudio集成开发环境。
    00:07 您可以从任何项目启动RStudioIDE。
    00:12 RStudio是用于统计计算和图形的编程语言 R 的免费开源集成开发环境。
    00:22 RStudio 有四个窗格:源窗格、控制台窗格、环境窗格和文件窗格。
    00:32 这些窗格可帮助您组织工作,并将使用 R 执行的不同任务分开。
    00:39 您可以拖动以调整窗格大小,也可以使用图标将窗格最小化和最大化。
    00:47 您还可以在全局选项中重新排列窗格。
    00:53 控制台窗格是 R 的接口。
    00:56 这正是您在与 R 捆绑在一起的终端窗口或用户界面中看到的内容。
    01:01 控制台窗格中确实有一些添加的功能,您会发现这些功能很有用。
    01:06 要从控制台运行代码,只需输入命令。
    01:11 开始输入命令以查看以您开始输入的字母开头的命令列表。
    01:17 突出显示列表中的命令,然后按 "Enter" 以插入该命令。
    01:24 使用向上箭头来滚动浏览先前输入的命令。
    01:31 当您发出更多命令时,可以滚动浏览结果。
    01:36 使用菜单选项来清除控制台。
    01:39 您还可以使用制表符补全来查看以该文本开头的函数,对象和数据集的列表。
    01:47 然后使用箭头突出显示命令以查看该命令的帮助。
    01:51 准备好后,只需按 "Enter" 键即可插入。
    01:55 接下来,您将在当前上下文中看到该命令的选项列表。
    01:59 例如, read.csv 函数的第一个自变量是文件。
    02:05 RStudio将显示工作目录中的文件夹和文件列表,以便您轻松找到要包含在参数中的文件。
    02:16 最后,如果使用带有期望包名 (例如库) 的函数的选项卡完成,那么您将看到所有已安装的包的列表。
    02:28 接下来,我们来看一下源窗格,它只是一个文本编辑器,供您编写 R 代码。
    02:34 文本编辑器支持 R 命令文件和纯文本以及其他几种语言,并在上下文中包含特定于语言的突出显示。
    02:47 您会注意到在文本编辑器中也提供了选项卡完成。
    02:53 从文本编辑器中,您可以运行单行代码,或者选择要运行的几行代码,您将在控制台窗格中看到结果。
    03:08 您可以将代码保存为 R 脚本,以便稍后共享或再次运行。
    03:15 视图函数将打开一个新选项卡,该选项卡以电子表格格式显示数据帧。
    03:22 或者可以在它自己的窗口中显示它。
    03:25 现在,您可以滚动数据,对列进行排序,搜索特定值或使用滑块和下拉菜单对行进行过滤。
    03:41 环境窗格包含 "环境" 选项卡, "历史记录" 选项卡和 "连接" 选项卡,并跟踪此 R 会话中发生的情况。
    03:51 "环境" 选项卡包含在会话期间创建的全局环境中存在的 R 对象。
    03:58 因此,当您在控制台窗格中创建新对象时,它会自动显示在环境窗格中。
    04:04 您还可以查看与特定包相关的对象,甚至可以查看特定函数的源代码。
    04:12 您还可以查看数据集列表,展开数据集以检查其各个元素,并在源窗格中查看这些元素。
    04:22 您可以将环境内容保存为 .RData 文件,以便稍后可以装入该 .RData 文件。
    04:29 从此处,您还可以清除工作空间中的对象。
    04:33 如果要删除特定项,请使用网格视图。
    04:38 例如,您可以轻松找到要删除的大项以释放 R 会话中的内存。
    04:45 "环境" 选项卡还允许您导入数据集。
    04:50 您可以在完成导入之前查看数据集和更改选项的预览。
    04:55 导入的数据将显示在源窗格中。
    05:00 "历史记录" 选项卡显示在命令行上运行的每个命令的历史记录。
    05:05 就像 "环境" 选项卡一样,您可以将历史记录另存为 .Rhistory 文件,以便稍后可以将其打开。
    05:11 此选项卡具有相同的选项,用于清除历史记录中的所有历史记录和个别条目。
    05:17 选择命令并将其发送到控制台以重新运行该命令。
    05:23 您还可以将命令复制到源窗格以将其包含在脚本中。
    05:31 在 "连接" 选项卡上,可以创建与数据源的新连接。
    05:36 此对话框中的选项取决于您已安装的软件包。
    05:41 例如, "BLUDB" 连接允许您连接到 Db2 Warehouse on Cloud 服务。
    05:49 "文件" 窗格包含 "文件" , "图" , "包" , "帮助" 和 "查看器" 选项卡。
    05:55 "文件" 选项卡显示工作目录的内容。
    05:59 RStudio将从该目录加载文件并将文件保存到该目录。
    06:04 浏览至文件,然后单击该文件以在源窗格中查看该文件。
    06:09 从此处,您可以通过选择要上载的单个文件或选择包含要上载的所有文件的 .zip 文件来创建新文件夹和上载文件。
    06:25 从此处,您还可以删除和重命名文件和文件夹。
    06:30 为了访问 R 中的文件,需要将数据文件夹设置为工作目录。
    06:36 您将看到 setwd 命令已在控制台中执行。
    06:43 您可以通过打开项目文件夹来访问项目中的数据资产。
    06:50 "图" 选项卡显示 R 的图函数的结果,例如: 图, hist , ggplot 和 xyplot
    07:00 您可以使用箭头或缩放来浏览不同图以查看图形全屏。
    07:09 您还可以从此处删除个别图或所有图。
    07:13 使用 "导出" 选项将图另存为指定分辨率的图形或打印文件。
    07:21 "软件包" 选项卡显示您当前已安装在系统库中的软件包。
    07:26 搜索栏让您快速找到特定数据包。
    07:30 选中的程序包是在当前会话中已使用库命令装入的程序包。
    07:38 您可以从此处检查其他软件包以将其装入,或者取消检查软件包以将其从当前会话中拆离。
    07:45 控制台窗格将显示结果。
    07:48 使用软件包名称旁边的 "X" 将其从系统库中除去。
    07:54 您还可以找到新软件包以安装或更新到任何软件包的最新版本。
    08:03 单击任何软件包将打开 "帮助" 选项卡,其中包含该软件包的其他信息。
    08:09 从这里,您可以搜索函数以获取更多帮助。
    08:13 在控制台中,您可以使用 help 命令,或者只需输入后跟该函数的问号,即可获取有关该函数的帮助。
    08:21 "查看器" 选项卡显示 HTML 输出。
    08:25 某些 R 函数生成 HTML 以显示报告和交互式图形。
    08:31 R Markdown软件包创建的报告可以在 "查看器 "选项卡中查看。
    08:38 Shiny 包将创建可以在 "查看器" 选项卡中查看的 Web 应用程序。
    08:44 其他包基于 htmlwidget 框架构建,包含基于 Java 的交互式可视化。
    08:54 您还可以将可视化发布到名为 "RPubs.com" 的免费站点。
    09:01 以上是RStudio集成开发环境的简要概述。
    09:05 Find more videos on RStudio in the Cloud Pak for Data as a Service documentation.

父主题: Notebook 和脚本

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more