您可以通过创建可视化来从数据中发现洞察。 通过使用可视化从不同角度浏览数据,您可以识别该数据中的模式,连接和关系,并快速了解大量信息。
- 个必需的服务
- watson.aiStudio或 IBM Knowledge Catalog
- 数据格式
- 表格 :Avro , CSV , JSON , Parquet , TSV , SAV , Microsoft Excel .xls 和 .xlsx 文件, SAS ,定界文本文件和已连接数据。
有关受支持的数据源的更多信息,请参阅 连接器。
- 数据大小
- 无限制
您可以创建类似于以下示例的图形,以显示湿度值随时间变化的情况。
创建可视化
您可以通过从 可视化 选项卡中选择预定义的图表类型来构建图表。
要创建使用项目中的资产的可视化:
- 在项目的 资产 选项卡上,单击资产类型列表中的 数据资产 ,然后选择数据资产。
- 单击 可视化 选项卡。
- 从图表或选择列开始。 在打开的 " 详细信息 " 窗格中选择图表并输入首选项。
如果首先选择列,那么将根据所选列从最相关的图表开始对可用图表进行排序。 数据的最佳图表以图表名称旁边的点表示。 根据所选数据,只有支持这些数据类型的图表和列可用。
构建图表时,画布会显示图表的预览,其中包含从数据中获取的变量标签和测量级别。
如果您关闭数据资产,或者从 可视化 选项卡切换,那么创建的图表不会保存在数据资产中。
- 选择 操作> 将可视化保存到项目 以保存可视化。 选择 创建新资产 或 附加到现有资产。 提供可视化资产名称,可选描述和图表名称,然后单击 应用。
已保存的资产将列示在项目中的 可视化 下。 您可以为同一数据资产创建不同的图表,并单独保存这些图表,或者将它们附加到项目中的同一可视化资产。
项目中已保存的可视化
您可以通过单击项目的 可视化 中可视化资产的名称来查看或编辑项目中的可视化。
在可视化资产的 布局 选项卡上,可以根据同一数据资产排列多个图表的布局,并生成 PDF 格式的输出或通过 HTML 链接生成输出。 您可以从 输出 选项卡下载 PDF 文件或获取 HTML 链接。
图形图表是根据最多 5,000 条记录的样本数据集生成的。
- 编辑可视化资产 在 图表 选项卡中。
- 选择 修改图表设置。
- 对图表设置进行更改以激活 保存 按钮。
- 单击保存。
您还可以通过此方式向可视化资产添加更多图表,并将其保存在项目中,而不必重新打开数据资产。
如果创建可视化资产,然后删除相应的数据资产,那么该可视化资产仍显示在项目中,但使用样本数据。 您可以在 数据 选项卡中查看原始数据集的数据模式。 然后,可以通过单击 从项目中选择来选择使用相同模式的新数据源。 如果项目中不存在具有此模式的数据资产,那么可视化资产仅保留项目中的样本数据,并且无法修改。 如果选择具有相同模式的新数据资产,那么必须通过编辑图表设置来刷新可视化资产,然后再次保存该资产。
概要文件 选项卡显示有关数据集的列的 审计 和 质量 信息。
- 最小值和最大值
- 平均值
- 标准偏差
- 偏度
- 唯一值数目
例如,在 质量 选项卡上,可以看到数据的每列的离群值或空值数。
您还可以通过单击 概要文件 工具栏中的图标来创建 Pearson 相关性和描述性统计信息 (包括频率)。
如果导出项目,那么还会导出可视化资产 (如果选中)。