单击 新建资产> 准备并可视化数据。
- 单击 从本地浏览 以上载新数据资产。
- 单击 从项目中选择 以选择先前上载的数据资产或连接。
数据资产:
- 选择数据文件 (选择内容包括已使用 Data Refinery进行塑形的数据文件)
- 选择已连接的数据资产
连接:
- 选择连接和文件
- 选择连接、文件夹和文件
- 选择连接、模式和表或视图
Data Refinery 支持以下文件类型 :Avro , CSV ,定界文本文件, JSON , Microsoft Excel (xls 和 xlsx 格式)。 仅第一个工作表,连接和已连接的数据资产除外。) Parquet , SAS ,具有 "sas7bdat" 扩展 (只读) 和 TSV (只读)
Data Refinery 对数据集中的部分行样本进行操作。 样本大小是 1 MB 或 10,000 行,以先达到者为准。 但是,运行 Data Refinery 流程作业时,就会处理整个数据集。 如果 Data Refinery 流因大型数据资产而失败,请参阅 对 Data Refinery中的变通方法。
以键图标 () 标记的数据连接已锁定。 如果您有权访问数据源,那么将要求您在首次选择该数据源时输入个人凭证。 此一次性步骤将为您永久解锁连接。 解锁该连接后,将不再显示此密钥图标。 请参阅添加项目连接。