今天跟一学SPSS软件的朋友交流,他问了一个问题,我觉得这个问题是学习使用软件首先要搞懂的。
第一步:问题理解和提出
在开始数据挖掘之前最基础的就是理解实际的业务问题,并在现有数据的基础之上提出解决问题的思路,对目标有明确的定义。
第二步:数据准备
获取原始的数据,并从中抽取一定数量的子集,建立数据挖掘库。如果是对新上市的产品,需要对产品的功能,应用,概念,价格,促销,渠道,市场反应等内容进行检测,建立营销试验田所需的稳定样本,进行数据挖掘。
第三步:数据整理
原始数据可能是不完全的、有噪声的、随机的,有复杂的数据结构,就要对数据进行初步的整理,清洗不完全的数据,做初步的描述性探索分析,提出不符合的样本,选择与数据挖掘有关的变量,或者转变变量。
第四步:建立模型
根据数据挖掘的目标和数据的特征,选择合适的模型,并参数估计,假设检验,比较选择最优的模型。
第五步:评价和解释
对数据挖掘的结果进行评价,选择最优的模型,作出评价,运用于实际问题,并且要和专业知识结合对结果进行解释。