SPSS数据挖掘产品和服务通过支持交叉行业数据挖掘标准流程(Cross-Industry Standard Process for Data Mining, CRISP-DM)而保证及时、可靠的结果,这是工业化标准化的数据挖掘过程。
成功的数据挖掘主要有如下及个阶段:
1商务理解。
从此阶段知道who,what,when,where,why,how,发展一个对项目参数的完全理解,目前商务情况,此项目的基本商务目标,成功的标准和谁来决定项目的成功性。
2数据理解。
首先确保数据的可用性。对数据进行探索性分析,数据是否覆盖相关特征,描述现有数据,检查数据质量,产生数据质量报告。
3数据准备。
主要是将原始数据抓换为最终的进行数据挖掘的数据集,数据的准备工作可能被多重实施,要对原始数据进行制表,整理,数据变量的选择,转换等,此阶段是流程中花费时间最多的。
4数据模型。
根据数据理解阶段的初步判断,确定什么技术适合此问题,模型构建前检测,构建模型,构建后检测,尝试不同的模型比较。
5成果发布。
决定如何来最好的利用结果来陈述你的问题
总结开发软件和模型
开发和评估替代性开发计划
确保结果怎样被分发给接收者
决定如何检测结果的应用
确定开发中可能存在的问题和缺陷
检测和维持计划
建立最终报告
6实施开发计划。
利用结果到实际中创造效益。