Go back to the English version of the documentation在 SPSS Modeler 中挖掘数据
SPSS Modeler 数据挖掘的项目阶段
Last updated: 2024年12月20日
SPSS Modeler 的工作流程是围绕跨行业数据挖掘标准流程 (CRISP-DM) 方法构建的。 这种方法将您在 SPSS Modeler 中的工作嵌入到一个包含多个阶段的大型项目中。 您在 SPSS Modeler 中的工作阶段使用项目来管理您的工作和资产。
数据挖掘阶段
CRISP-DM 方法分为以下几个阶段。
- 业务理解
- 在这一阶段,应尽可能深入了解数据挖掘的业务目标。 与利益相关者会面,确定您使用 SPSS Modeler 的工作如何解决业务目标或问题。
更多信息,请参阅了解和准备数据。
- 数据理解
- 在 SPSS Modeler 中建立流程之前,您需要收集和了解您的数据。 花时间了解数据的结构、关系和模式。
更多信息,请参阅了解和准备数据。
- 数据准备
- 在 SPSS Modeler 中训练模型之前,您需要准备好数据。 花时间处理您的数据,以便优化数据挖掘的使用。
更多信息,请参阅了解和准备数据。
- 建模
- 建立 SPSS Modeler 流程来探索数据、尝试不同的模型并研究各种关系,从而找到有用的信息。
更多信息,请参阅构建流程和模型。
- 部署
在建立和训练预测模型后,如果有 watsonx.ai Runtime 服务,您可以将其推广到 watsonx.ai Runtime 。
有关详细信息,请参阅推广 SPSS Modeler 流程和模型。
- 评估
- 评估模型及其预测的质量。 例如,您可以在流程中添加分析节点,以评估模型预测的准确性。 您还可以使用 " 评估 "节点来比较预测模型并找出最佳模型。
处理项目和数据资产
您使用 SPSS Modeler 的所有工作都是在一个项目中完成的。 一个项目包含所有数据资产和数据流。
您可以将 SPSS Modeler 连接到数据库等数据源,以便在 SPSS Modeler 中更轻松地访问数据。
有关连接数据的更多信息,请参阅支持的数据源
您可以导入在 SPSS Modeler Subscription 或 SPSS Modeler 客户端中创建的数据流 ( .str )。 如果导入的流程包含一个或多个导入或导出节点,则会在打开流程时提示您转换节点。
更多信息,请参阅导入 SPSS Modeler 数据流。
脚本编制
您可以在 SPSS Modeler 中使用脚本来自动执行任务。 您可以使用 R、 Python 或 Python for Spark 以及表达式处理控制语言(CLEM)编写脚本。 CLEM 是一种用于分析和操作数据流的语言。
更多信息,请参阅脚本和自动化。