Translation not up to date
R 是一种流行的统计分析和机器学习软件包,可用于数据管理,包括测试、模型、分析和图形。RStudio 包含在IBM watsonx.aiStudio 中,为使用 R 脚本提供了一个集成开发环境。
使用信息和限制
- RStudio已集成到IBM watsonx.aiStudio 项目中。 您可以在创建项目后启动它。
- 您可以访问和使用存储在与项目相关联的 IBM Cloud Object Storage 存储桶中的数据文件。
- 您可以使用RStudioIDE 创建 Shiny 应用程序,但不能将它们部署到Cloud Pak for Data as a Service中。
启动RStudio集成开发环境
在项目中启动RStudioIDE:
从项目操作栏上的 "启动 IDE"菜单中单击RStudio。
选择环境。
单击启动。
这会启动环境运行时,开发环境随即打开。
如果在启动RStudio 时遇到问题,请参阅故障排除与启动RStudio有关的问题。
启动RStudioIDE 时的故障排除问题
启动RStudio 时可能会遇到以下问题:
前一个会话中损坏的RStudio状态
问题:"
有时,当您启动RStudio会话时,可能会遇到前一个会话的RStudio状态已损坏的情况,导致会话无法启动。
解决方案:'
启动RStudioIDE 后,在选择RStudio环境的阶段,选择重置工作区。 启动RStudio时使用的是默认设置和干净的RStudio工作区。
处理数据文件
在 RStudio 中,您可以处理来自不同源的数据文件:
RStudio 服务器文件结构中的文件,您可通过单击 RStudio 右下角的文件来查看这些文件。 您可以在这里创建文件夹、从本地系统上载文件,以及删除文件。
要在 R 中访问这些文件,必须将工作目录设置为这些文件所在的目录。 您可以通过使用文件浏览到目录并单击 更多> 设置为工作目录来执行此操作。
请注意,存储在 Rstudio 实例的
Home
目录中的文件仅在该实例中持久存储,无法跨环境或在项目中共享。请观看此视频,以了解如何将数据装入到 RStudio 中。
此视频提供了一种可视方法来学习本文档中的概念和任务。
存储在与项目关联的 IBM Cloud Object Storage 存储区中的项目数据资产。 启动 RStudio 后,IBM Cloud Object Storage 存储区内容将安装到 RStudio
Home
目录中的project-objectstorage
目录。如果希望数据文件显示在
project-objectstorage
目录中,那么必须将其作为资产添加到项目。 请参阅将文件添加为项目资产。如果在您处于 RStudio 中时将新数据资产添加到项目,并且您要访问这些数据资产,那么需要刷新
project-objectstorage
文件夹。存储在数据库系统中的数据。
观看此视频以了解如何在 RStudio 中连接到外部数据源。
此视频提供了一种可视方法来学习本文档中的概念和任务。
安装到
/home/rstudio
的 存储在本地存储器中的文件 。home
目录的存储限制为 2 GB,用于存储RStudio会话工作区。 请注意,无论您是否在每个项目中使用RStudio,您的 "home
目录存储空间在所有项目中都分配为 2 GB。 因此,您只应该将 R 脚本文件和小数据文件存储在home
目录中。 它不适用于大型数据文件或大型生成的输出。 应将所有大型数据文件作为项目资产上载,这些资产将安装到project-objectstorage
目录中,您可以从该目录访问这些数据文件。
将文件添加为项目资产
如果希望数据文件出现在 project-objectstorage
目录中,必须将它们作为数据资产添加到项目中。 要将这些文件作为数据资产添加到项目中,请执行以下操作:
- 在项目的 "资产 "页面上,单击 Upload asset to project 图标 并选择 Files 选项卡。
- 选择要作为资产添加到项目中的文件。
- 从“操作”列表中,选择添加为数据资产并应用更改。
容量使用情况和运行时作用域
RStudio环境运行时的作用域总是环境模板和RStudio会话用户。 每个watsonx.aiStudio 用户一次只能激活一个RStudio会话。 如果您在另一个项目中启动了RStudio,系统会询问您是否要停止该会话,并在当前项目的上下文中启动一个新的RStudio会话。
运行时使用情况根据活动环境运行时使用的容量单位小时数 (CUH) 进行计算。 项目中的活动 RStudio 运行时使用的 CUH 会计入项目创建者的帐户。 请参阅 RStudio 的每小时容量单位计费。
您可以在项目的 "环境"页面上查看哪些RStudio环境运行时处于活动状态。 您可以从此页面停止运行时。
切记:当运行时处于激活状态时,CUH 计数器会继续增加,因此如果您不使用RStudio,请停止运行时。 如果您没有明确停止运行时间,则运行时间会在闲置 2 小时后自动停止。 在此空闲时间内,您将继续使用您所付费的 CUH。 长时间计算密集型作业会在 24 小时后硬停止。
观看此视频以领会对 RStudio IDE 的概述。
此视频提供了一种可视方法来学习本文档中的概念和任务。
视频脚本 时间 脚本 00:00 这段视频将快速介绍一个项目中的RStudio集成开发环境。 00:07 您可以从任何项目启动RStudioIDE。 00:12 RStudio是用于统计计算和图形的编程语言 R 的免费开源集成开发环境。 00:22 RStudio 有四个窗格:源窗格、控制台窗格、环境窗格和文件窗格。 00:32 这些窗格可帮助您组织工作,并将使用 R 执行的不同任务分开。 00:39 您可以拖动以调整窗格大小,也可以使用图标将窗格最小化和最大化。 00:47 您还可以在全局选项中重新排列窗格。 00:53 控制台窗格是 R 的接口。 00:56 这正是您在与 R 捆绑在一起的终端窗口或用户界面中看到的内容。 01:01 控制台窗格中确实有一些添加的功能,您会发现这些功能很有用。 01:06 要从控制台运行代码,只需输入命令。 01:11 开始输入命令以查看以您开始输入的字母开头的命令列表。 01:17 突出显示列表中的命令,然后按 "Enter" 以插入该命令。 01:24 使用向上箭头来滚动浏览先前输入的命令。 01:31 当您发出更多命令时,可以滚动浏览结果。 01:36 使用菜单选项来清除控制台。 01:39 您还可以使用制表符补全来查看以该文本开头的函数,对象和数据集的列表。 01:47 然后使用箭头突出显示命令以查看该命令的帮助。 01:51 准备好后,只需按 "Enter" 键即可插入。 01:55 接下来,您将在当前上下文中看到该命令的选项列表。 01:59 例如, read.csv 函数的第一个自变量是文件。 02:05 RStudio将显示工作目录中的文件夹和文件列表,以便您轻松找到要包含在参数中的文件。 02:16 最后,如果使用带有期望包名 (例如库) 的函数的选项卡完成,那么您将看到所有已安装的包的列表。 02:28 接下来,我们来看一下源窗格,它只是一个文本编辑器,供您编写 R 代码。 02:34 文本编辑器支持 R 命令文件和纯文本以及其他几种语言,并在上下文中包含特定于语言的突出显示。 02:47 您会注意到在文本编辑器中也提供了选项卡完成。 02:53 从文本编辑器中,您可以运行单行代码,或者选择要运行的几行代码,您将在控制台窗格中看到结果。 03:08 您可以将代码保存为 R 脚本,以便稍后共享或再次运行。 03:15 视图函数将打开一个新选项卡,该选项卡以电子表格格式显示数据帧。 03:22 或者可以在它自己的窗口中显示它。 03:25 现在,您可以滚动数据,对列进行排序,搜索特定值或使用滑块和下拉菜单对行进行过滤。 03:41 环境窗格包含 "环境" 选项卡, "历史记录" 选项卡和 "连接" 选项卡,并跟踪此 R 会话中发生的情况。 03:51 "环境" 选项卡包含在会话期间创建的全局环境中存在的 R 对象。 03:58 因此,当您在控制台窗格中创建新对象时,它会自动显示在环境窗格中。 04:04 您还可以查看与特定包相关的对象,甚至可以查看特定函数的源代码。 04:12 您还可以查看数据集列表,展开数据集以检查其各个元素,并在源窗格中查看这些元素。 04:22 您可以将环境内容保存为 .RData 文件,以便稍后可以装入该 .RData 文件。 04:29 从此处,您还可以清除工作空间中的对象。 04:33 如果要删除特定项,请使用网格视图。 04:38 例如,您可以轻松找到要删除的大项以释放 R 会话中的内存。 04:45 "环境" 选项卡还允许您导入数据集。 04:50 您可以在完成导入之前查看数据集和更改选项的预览。 04:55 导入的数据将显示在源窗格中。 05:00 "历史记录" 选项卡显示在命令行上运行的每个命令的历史记录。 05:05 就像 "环境" 选项卡一样,您可以将历史记录另存为 .Rhistory 文件,以便稍后可以将其打开。 05:11 此选项卡具有相同的选项,用于清除历史记录中的所有历史记录和个别条目。 05:17 选择命令并将其发送到控制台以重新运行该命令。 05:23 您还可以将命令复制到源窗格以将其包含在脚本中。 05:31 在 "连接" 选项卡上,可以创建与数据源的新连接。 05:36 此对话框中的选项取决于您已安装的软件包。 05:41 例如, "BLUDB" 连接允许您连接到 Db2 Warehouse on Cloud 服务。 05:49 "文件" 窗格包含 "文件" , "图" , "包" , "帮助" 和 "查看器" 选项卡。 05:55 "文件" 选项卡显示工作目录的内容。 05:59 RStudio将从该目录加载文件并将文件保存到该目录。 06:04 浏览至文件,然后单击该文件以在源窗格中查看该文件。 06:09 从此处,您可以通过选择要上载的单个文件或选择包含要上载的所有文件的 .zip 文件来创建新文件夹和上载文件。 06:25 从此处,您还可以删除和重命名文件和文件夹。 06:30 为了访问 R 中的文件,需要将数据文件夹设置为工作目录。 06:36 您将看到 setwd 命令已在控制台中执行。 06:43 您可以通过打开项目文件夹来访问项目中的数据资产。 06:50 "图" 选项卡显示 R 的图函数的结果,例如: 图, hist , ggplot 和 xyplot 07:00 您可以使用箭头或缩放来浏览不同图以查看图形全屏。 07:09 您还可以从此处删除个别图或所有图。 07:13 使用 "导出" 选项将图另存为指定分辨率的图形或打印文件。 07:21 "软件包" 选项卡显示您当前已安装在系统库中的软件包。 07:26 搜索栏让您快速找到特定数据包。 07:30 选中的程序包是在当前会话中已使用库命令装入的程序包。 07:38 您可以从此处检查其他软件包以将其装入,或者取消检查软件包以将其从当前会话中拆离。 07:45 控制台窗格将显示结果。 07:48 使用软件包名称旁边的 "X" 将其从系统库中除去。 07:54 您还可以找到新软件包以安装或更新到任何软件包的最新版本。 08:03 单击任何软件包将打开 "帮助" 选项卡,其中包含该软件包的其他信息。 08:09 从这里,您可以搜索函数以获取更多帮助。 08:13 在控制台中,您可以使用 help 命令,或者只需输入后跟该函数的问号,即可获取有关该函数的帮助。 08:21 "查看器" 选项卡显示 HTML 输出。 08:25 某些 R 函数生成 HTML 以显示报告和交互式图形。 08:31 R Markdown软件包创建的报告可以在 "查看器 "选项卡中查看。 08:38 Shiny 包将创建可以在 "查看器" 选项卡中查看的 Web 应用程序。 08:44 其他包基于 htmlwidget 框架构建,包含基于 Java 的交互式可视化。 08:54 您还可以将可视化发布到名为 "RPubs.com" 的免费站点。 09:01 以上是RStudio集成开发环境的简要概述。 09:05 Find more videos on RStudio in the Cloud Pak for Data as a Service documentation.
父主题: Notebook 和脚本