您可以创建 Notebook,用于运行代码以准备、可视化和分析数据,或者构建和训练模型。 阅读有关Jupyter笔记本的信息,然后观看视频并学习适合有一定Python代码知识用户的教程。
- 必需服务
- watsonx.ai工作室
基本工作流程包含以下任务:
- 创建项目。 项目是您与其他人协作处理数据的地方。
- 将您的数据添加到项目中。 您可以通过连接从远程数据源添加 CSV 文件或数据。
- 在项目中创建 Notebook。
- 将代码添加到 Notebook 以装入和分析数据。
- 运行您的 Notebook 并与同事分享结果。
阅读有关 Notebook 的信息
Jupyter Notebook 是基于 Web 的交互式计算环境。 您可以运行少量代码来处理数据,并可以立即查看计算的结果。 Notebook 中包含处理数据所需的所有构建块:
- 数据
- 用于处理数据的代码计算
- 结果直观表示
- 用于增进了解的文本和富媒体
观看有关 Notebook 的视频
观看本视频,了解Jupyter笔记本的基础知识。
此视频提供了一种可视方法来学习本文档中的概念和任务。
尝试利用教程创建 Notebook
在本教程中,您将完成以下任务:
- 任务 1: 打开项目。
- 任务 2: 向项目添加 Notebook。
- 任务 3: 装入文件并保存 Notebook。
- 任务 4: 查找并编辑 Notebook。
- 任务 5: 共享 Notebook 的只读版本。
- 任务 6: 将 Notebook 调度为在不同时间运行。
完成本教程大约需要 15 分钟。
完成本教程的提示
以下是成功完成本教程的一些提示。
使用视频图片
以下动画图像显示了如何使用视频图片和目录功能:
在社区中获取帮助
如果您需要本教程的帮助,可以在Cloud Pak for Data社区讨论区提问或寻找答案。
设置浏览器窗口
为了获得完成本教程的最佳体验,请在一个浏览器窗口中打开 Cloud Pak for Data ,并在另一个浏览器窗口中保持本教程页面处于打开状态,以便在两个应用程序之间轻松切换。 请考虑将两个浏览器窗口并排排列,以便更轻松地进行后续操作。
任务 1: 打开项目
您需要一个项目来存储 Notebook 和数据资产。 您可以使用现有项目或创建项目。 执行以下步骤以打开项目并将数据资产添加到项目:
从导航菜单",选择项目 > 查看所有项目
打开现有项目。 如果要使用新项目:
单击新建项目。
选择创建空项目。
输入项目的名称和可选描述。
选择现有的对象存储服务实例或者创建新的对象存储服务实例。
单击创建。
从导航菜单",单击资源中心。
搜索并找到感兴趣的数据集,然后选择该数据集。
单击添加到项目。
从列表中选择项目,然后单击添加。
添加数据集后,单击查看项目。
在项目中,单击 资产 选项卡以查看数据集。
更多信息,请参阅创建项目。
有关在项目中添加资源中心资产以便在笔记本中访问的更多信息,请参阅在笔记本中加载和访问数据。
检查您的进度
下图显示了项目中的 "资产" 选项卡。
任务 2: 向项目添加 Notebook
To preview this task, watch the video beginning at 00:06.
执行以下步骤以在项目中创建新的 Notebook。
在您的项目中,资产选项卡,点击新资产 > 使用数据和模型Python或 R 笔记本。
输入名称和描述 (可选)。
选择此 Notebook 的运行时环境。
单击创建。 等待 Notebook 编辑器装入。
检查您的进度
下图显示了空白 Notebook。
任务 3: 装入文件并保存 Notebook
To preview this task, watch the video beginning at 00:23.
现在,您可以访问先前上载到项目的 Notebook 中的数据资产。 执行以下步骤以将数据装入到数据帧中:
单击 Notebook 中的空代码单元格。
点击代码片段图标()。
在侧窗格中,单击 读取数据。
单击 从项目中选择数据。
从项目中找到数据资产,然后单击 选择。
在 装入方式 下拉列表中,选择您首选的装入选项。
单击 将代码插入单元格。 用于读取和装入数据资产的代码将插入到单元格中。
点击运行图标 "运行代码。 将显示数据集的前几行。
要保存笔记本的版本,请单击 文件> 保存版本。 您还可以使用 文件> 保存来保存 Notebook。
检查您的进度
下图显示了具有 pandas DataFrame的 Notebook。
任务 4: 查找和编辑 Notebook
To preview this task, watch the video beginning at 01:19.
执行以下步骤以在 "资产" 选项卡上找到已保存的 Notebook ,然后编辑该 Notebook:
在项目导航跟踪中,单击项目名称以返回到项目。
单击 资产 选项卡以查找 Notebook。
单击 Notebook 时,它将以
READ ONLY
方式打开。要编辑笔记本,请单击铅笔图标 "。
单击信息图标 "打开信息面板。
在常规选项卡上,编辑 Notebook 的名称和描述。
单击 环境 选项卡以查看如何更改用于运行 Notebook 的环境或将运行时状态更新为 "停止" 和 "重新启动"。
检查您的进度
下图显示了显示了 "信息" 面板的笔记本。
任务 5: 共享笔记本的只读版本
To preview this task, watch the video beginning at 01:52.
执行以下步骤以创建指向 Notebook 的链接,以便与同事共享:
如果您想共享笔记本的只读视图,请单击 "共享"图标 "。
单击以开启与具有链接的任何人共享切换按钮。
选择要通过链接或社交媒体共享的内容。
单击复制图标 ",复制到本笔记本的直接链接。
单击关闭。
检查您的进度
下图显示了 "共享" 对话框。
任务 6: 调度 Notebook 在不同时间运行
To preview this task, watch the video beginning at 02:08.
请遵循以下步骤来创建作业,以将 Notebook 调度为在特定时间运行,或者根据调度重复执行:
单击 "作业"图标,然后选择 "创建作业"。
提供作业的名称和描述,然后单击下一步。
选择 Notebook 版本和环境运行时,然后单击下一步。
(可选)单击切换按钮以安排运行。 指定日期、时间以及是否希望重复运行作业,然后单击下一步。
(可选) 单击切换按钮以接收此作业的通知,然后单击 下一步。
查看详细信息,然后单击创建(创建作业,但不立即运行作业)或创建并运行(立即运行作业)。
该作业将显示在项目的作业选项卡中。
检查您的进度
下图显示了 "作业" 选项卡。
后续步骤
现在,您可以使用此数据集开展进一步分析。 例如,您或其他用户可以执行以下任何任务:
其他资源
观看更多视频。
在资源中心查找示例数据集和笔记本,获取完善数据的实践经验。
使用 IBM 提供的行业加速器加速处理数据,这是一组端到端解决方案,您可以将其作为示例运行,或者对其进行定制以解决常见业务问题。 大多数加速器都包含样本项目,其中具有分析数据、构建模型和显示结果所需的一切内容。
父主题: 快速入门教程